INSIGHTS

営業AIにおける自己改善ループと「探索」について

営業AIを運用するうえで重要なのは、最初から完璧な営業トークを作ることではありません。むしろ重要なのは、実際の顧客反応をもとに、トークを継続的に改善していく仕組みを持つことです。固定されたトークだけでは改善が止まる営業トークは、一度うまくいく型が見つかると、その型を使い続けた

低レイテンシ Realtime AI における State Management について

Sub-500ms Real-Time AI Agents:低レイテンシ応答を支える状態制御アーキテクチャ リアルタイムAIエージェントの設計では、通常のAIエージェントとは異なる制約が生まれます。特に、音声対話や業務オペレーション支援のように、人間の会話や判断の流れに

AIにおける Intelligence Distillation について

LLMアプリ開発の本質は「高コストな知能の蒸留」にあるLLMを使ったアプリケーション開発では、モデル選定やプロンプト設計が注目されがちです。しかし実務で本当に重要なのは、単に「どのモデルを使うか」ではありません。より本質的には、高品質だが高コストな知能を、

DeepMind社の「AlphaDev」について詳しく解説。

GPTのシステム開発を行っている渋谷のLEAGENCEです。今回はAIが強化学習によってアルゴリズム開発を行うGoogle DeepMind「AlphaDev」について解説したいと思います。記事はこちらhttps://www.nature.com/articles/s41586-023-

text-embedding-ada-002が内部で行っているトークン化について解説

ada-002を用いたシステム開発において、内部で行われているトークン化の重要性やメリットを明らかにすることが本稿の目的です。text-embedding-ada-002は、テキストデータを扱う機械学習プロジェクトにおいて、トークン化というプロセスを実行します。このトークン化がなぜ必要で、

GPT4の返答速度について解説

OpenAIのGPTシリーズは、その高度な言語生成能力で話題となっています。GPT-3.5-turboとGPT-4の返答速度について、本記事ではわかりやすく詳しく解説していきます。ただし、結果にはばらつきがあることをご了承ください。【GPT-3.5-turboの速度】GPT

Pineconeの特徴である「疎密埋め込み」について解説

「疎密埋め込み」(Sparse-dense embeddings)は、疎なベクトル(sparse vectors)と密なベクトル(dense vectors)の両方の特性を持ったベクトル表現です。それぞれの特性を理解するために、以下に疎なベクトルと密なベクトルの例を示します。疎なベクトル(

TOP