リスク警告:「仮想通貨」「ブロックチェーン」の名のもとでの違法な資金調達のリスクに注意してください。—銀行保険監督管理委員会など5部門
検索
ログイン
简中
繁中
English
日本語
한국어
ภาษาไทย
Tiếng Việt
BTC
ETH
HTX
SOL
BNB
View Market
Metya AI Labが初の大規模ソーシャルモデルを発表、AIソーシャルネットワーキングの効率が116.3%さらに向上しました。
星球君的朋友们
Odaily资深作者
3時間前
この記事は約3689文字で、全文を読むには約6分かかります
判断がブラックボックスではなくなり、会話が滞留する必要がなくなり、言語間の障壁もなくなると、より快適な出会いがより頻繁に起こるようになるでしょう。

システムがユーザーの話し終えるのを待って応答するのではなく、会話のリズムを捉え、感情を読み取り、中断にも対応できるようになると、オンラインでの出会いの質は静かに塗り替えられるでしょう。コーネル大学のMetya AIラボは、スムーズな会話の実現と、同じ会話内での会話制御を同時に実現する新しいソーシャルモデルを発表しました。音声側は真の全二重通信を実現し、ユーザーは聞きながら同時に話すことができ、自然に割り込んだり、自ら割り込んだりすることさえ可能です。コンテンツ側は明確で追跡可能な証拠を提供し、「できますか?」と尋ねるだけでなく、「なぜ?」と「どうすればもっとうまくできるのか」を同時に提示します。発表イベントでは、専門用語を多用する議論を避け、実際のデモンストレーションを用いてシステムを説明しました。多言語の興味関心を持つ人々が集まる部屋に入ると、システムは軽いオープニングトピックと自然な話し順を提供しました。誰かが疑わしい短縮リンクを投稿すると、サイドバーに関連用語と提案アクションが即座に表示され、会話を中断することはありません。会話が途切れた場合は、タイミングの良い「リレー質問」を使って、前回話さなかった人とつながり、会話を再現しました。

Metya AI Labの責任者は、「ソーシャルネットワーキングは質問に答える場ではなく、デートはなおさらです。私たちは、スムーズな会話と明確な意思決定という2つの要素を確かなものにすることを目指しています。スムーズとは、中断やスムーズな再接続を可能にする安定したリズムを意味します。明確とは、すべてのリマインダーに根拠があり、後で確認できることを意味します。この2つの要素を同じ会話に統合することで、オンラインでの出会いは真に温かく、秩序ある体験となるでしょう」と述べています。

1. 全二重会話と解釈可能な判断:同じ会話にリズムと証拠を取り戻す

従来の人間とコンピュータの会話は、ターン制御と沈黙の閾値に依存しています。つまり、ユーザーが話し終えると、システムが応答するのです。この「トランシーバー」のようなインタラクションは、複数の人が同時にいたり、感情が高ぶっていたりすると、ぎこちなくなってしまうことがあります。Metyaのソーシャルマクロモデルは、全二重インタラクションに基づいており、システムはメッセージを中断することなく、聞きながら同時に話すことができます。相手が重要なポイントで沈黙すると、システムは適切な返答や質問で応答します。強い発言意欲を検知すると、システムは一時停止して会話の主導権を委譲します。これは、会話を中断したり、機械的に挨拶を挿入したりすることではなく、継続的で調和のとれた「リズム調整」です。

複数人での音声会議において、システムは「抑制された司会者」の役割を果たします。抑制とは、主役を奪うようなことはせず、軽快なタイミング、点呼、会話の締めくくり、そして気まずい沈黙の解消といった要素を巧みに利用することで、参加者が快適なペースで会話を楽しみ、また相手に見られるよう支援することです。気まずい沈黙が一定時間を超えると、システムは「リレー質問」を仕掛けます。発言が話題から逸れた場合は、システムは議論を一文で要約します。感情が高ぶった場合は、音量を下げ、話す速度を落として「雑音を抑制」し、秩序を取り戻します。同時に、バックグラウンドでは常に多言語同時通訳が行われます。異なる言語の参加者がそれぞれの母国語で話すと、システムがリアルタイムで意味を整合させるため、字幕を追加したり遅延感を感じさせたりする必要がなくなり、言語が最初のハードルとなることがなくなります。

「スムーズさ」に加えて、「明確さ」も必要です。Metyaは、コンテンツガバナンスをブラックボックス的な「合否」判定から、説明可能な証拠の連鎖へと進化させます。不適切な表現、危険なリンク、または誘導されたアウトバウンドジャンプが発生した場合、システムは会話を突然中断しません。代わりに、元の文、影響を受けた節、判定の理由、信頼度、そして推奨されるアクションをサイドバーに同時に表示します。単なる口の滑りや文脈上のジョークであれば、まず口頭で注意を促すことが推奨されます。それが繰り返される場合は、ユーザーをミュートまたは削除できます。この「段階的なアプローチ」は、場の雰囲気を乱すことなく、「なぜ」と「次に何をすべきか」を説明します。オペレーション担当者とパートナーは、証拠の断片を直接クリックして検証できます。ユーザーは、関連する指示を確認し、必要に応じて苦情を申し立てることもできます。 「制限チェーン」ではなく「透明なチェーン」と呼ぶ方が適切です。すべてのアクションは基礎まで遡ることができ、すべての基礎をレビューできます。

エンジニアリング面では、安定性は包括的なソリューションスイートから生まれます。スピーカー分離、エコー抑制、周囲ノイズ低減機能を備えた音響フロントエンドは、正確で安定した割り込み検出を実現します。「リズムステートマシン」は発言の順番を調整し、「話しながら聞く」ことが「マイクを奪い合う」状況にエスカレートするのを防ぎます。設定可能なホスティングスタイル(控えめ、活発、プロフェッショナル)は、さまざまな部屋の種類や参加者の性格に適応します。コンテンツ面では、コミュニティの規範は「項目 - 反例 - 境界の説明」からなる強制可能なチェックリストに細分化されており、意図しない強制のリスクを軽減します。これらすべては、システムが複雑さを自ら処理し、ユーザーにとっての信頼性を維持するという、一つの目標に集中しています。

2. Metyaとのフルチェーン統合:見られることから話すこと、レビューすることまで

これは単なるデモ機能ではありません。Metyaデートアプリにネイティブに組み込まれた、現実の旅です。出会いから最初の会話、そして次に会うかどうかの決断まで、システムは重要な瞬間に適切なサポートを提供します。

「見られる」段階では、システムは情報、最近の動向、話題の好みを組み合わせて「相性プロフィール」を生成し、互いに「気が合う」可能性が高い人を優先します。異なる言語同士のマッチングでは、会話開始前から言語による行き詰まりを避けるため、デフォルトで多言語同時通訳が有効になります。気まずい沈黙が生まれやすい組み合わせでは、「最近の思いがけない幸せ」「繰り返し観る映画」「週末に半日どこへ行くか」といった3つの軽い話題が候補カードに事前に設定され、会話の始まりをより魅力的で温かいものにします。多くのユーザーがここで得るのは、教え込まれた「スキル」ではなく、「発言する勇気」です。

1対1でもパーティールームでも、会話を始める準備が整うと、「スマートオープニング」が発言順とオープニングトピックを瞬時に生成します。このシステムは「司会進行役」として機能し、全二重モードで一定のペースを維持します。誰かが割り込んできた場合は、システムはプロンプトなしで自然に譲歩します。会話が脱線した場合は、キーワードを含む要約で優しく締めくくります。参加が必要な場合は、前回のラウンドで発言しなかった人に「リレー質問」が送られ、一部の人が長時間マイクを独占するのを防ぎます。さらに重要なのは、不適切な表現やリンクが言及された場合、サイドバーに即座にコンテキストと推奨アクションが表示されるため、会話が中断されることはありません。司会者は、インイヤーフィードバックシステムを通じて、控えめなプロンプト(「要点を繰り返してください」「別の視点からの回答」「具体的な例を挙げてください」など)を受け取ります。これらのプロンプトは全員に送信されるのではなく、司会者がポジティブなトーンと丁寧さを維持するのに役立ちます。

会話をより良い出会いに変えるための前提条件は、優れたレビューです。会話の終わり近くに、システムは会話の要約を自動的に生成します。効果的なラウンド、一人あたりの平均発言数、中断による遅延、議論されたトピックの収束、ジョークと意見の相違、ブロックされたリスクの高いコンテンツ(元の文章と補足的な断片を含む)、そして「手動レビューを推奨」されたジョークやセンシティブな断片が表示されます。ユーザーが目にする要約は「評価」ではなく、参考となる「レビュー」です。つまり、どの点が互いに共鳴したか、意見は異なっていたものの衝突しなかった箇所、会話を音声で続けるか、テキストに変換するか、それとも直接会ってコーヒーを飲む約束をするかなどです。システムは、自然な進行と敬意を払った締めくくりの2種類の丁寧な会話を提供します。運用チームと作成者はどちらもワンクリックで要約をエクスポートできるため、翌日に「雰囲気を思い出す」必要がなくなり、レビューのための確固たる基盤となります。

2つの実際のプロセスシナリオは、その使い方をより直感的に示しています。1つ目は、異言語対応のスピードルームマッチングです。最初の60秒で打ち解けます。3分後、メンバーがトラフィック増加の疑いのあるショートリンクを投稿します。サイドバーに「基準達成 + 推奨アクション」が表示されます。ホストはユーザーに口頭で注意を促しますが、状況は再発し、途切れることなくエスカレートします。20秒間の沈黙の後、システムは「リレー質問」を提示し、前のラウンドで沈黙していた参加者に話しかけ、会話を迅速に再開します。2つ目は、最初の1対1通話です。システムはインイヤーフィードバックシステムを通じてユーザーに「具体的に話してください」と促し、曖昧な表現を文脈に沿って理解できるようにします。ユーザーがプライバシーの境界を越えた場合、インターフェースは同時に「境界リマインダー + 丁寧な断り」プロンプトを表示し、失礼にならないように境界を明確にします。通話が終了する前に、両者は会話の要約と「次のステップの提案」を受け取り、ユーザーが常に最終決定権を持つことが保証されます。

Metya AI Labの責任者は、同社の製品哲学について次のように述べています。「私たちは誇張した擬人化を追求したり、会話の真実味を隠すために派手な効果を使ったりしません。テクノロジーは一歩後退し、待ち時間、誤解、言語の壁といった障害を取り除き、『システムとどのようにコミュニケーションするか』ではなく、『何を言うか』に焦点を戻します。」

3.データ、境界、そしてオープン性:信頼と進歩を検証可能にする

ブランドプロミスは検証可能でなければなりません。The LabとMetyaは、同じ指標を用いて、同じユーザー層をターゲットにし、同じ期間で4つのコア指標を公開します。ガバナンス(違反露出率、誤ブロック/不在着信)、エンゲージメント(中断応答の遅延、ユーザーあたりの平均コメント数、発言範囲)、リテンション(ルーム滞在、翌日/7日以内の再訪問)、コンバージョン(閲覧からフォロー/招待までの経路)です。すべての結論はサンプルと証拠に基づいて追跡可能です。四半期レポートには、サンプル方法と信頼区間の説明を記載し、指標の変更による進捗の錯覚を回避します。

境界も明確に示されています。まず、非常に騒音の多い状況や複数の人が同時に話している状況では、聞き間違いや文の途切れが発生する可能性があります。チームは、話者分離、ノイズ低減、エコー抑制を継続的なイテレーション計画に組み込み、プラットフォーム側に「異常会話再生」メカニズムを構築することで、迅速なトラブルシューティングを実現しました。次に、ユーモア、風刺、地域性といった文化的な尺度には違いがあります。研究室とパートナーは共同で「サンプルライブラリとグレースケールルール」を構築し、「画一的な」ものではなく「何が言えて何が言えないのか」の境界を明確にします。さらに、企業側はトレーニングやローカルストレージへの参加を控えることもできます。すべての機密情報の取り扱いは追跡可能、監査可能、そして異議申し立てが可能であり、必要に応じて第三者による監査を導入することで、ガバナンスの強固さと限界を確保します。

一般の方々とオープンに交流できるよう、ラボは段階的に機能インターフェースを提供していきます。具体的には、違反や完全な証拠チェーンを出力するコンテンツ検査、全二重テンポ制御とスタイル設定を備えた音声ホスティング、多言語同時会話をサポートする同時通訳、セッション概要と証拠スニペット(CSV/JSON)を含む記録エクスポートなどです。これらのインターフェースはプラグイン設計となっており、スタンドアロンアクセスまたはプラットフォームとの緊密な統合が可能です。教育、オンラインイベント、言語交換といった垂直分野向けには、シナリオベースのテンプレートと丁寧な話し方のライブラリを提供することで、概念実証から運用開始までの時間を短縮します。オープンであることは単なる宣言ではなく、機能を標準化された構成要素へと変換し、より幅広い実世界のシナリオにおいてスムーズかつ明確な再利用を可能にすることです。

研究開発ロードマップも明確です。現在のフェーズでは、1対1、興味関心に基づくマッチング、そして複数人参加型パーティールームの安定性とユーザーエクスペリエンスの向上に重点を置いています。次のフェーズでは、インターフェースとホストスタイル設定の公開、「境界/丁寧な断りのスクリプトライブラリ」のリリース、そして多言語対応範囲の拡大が予定されています。その後、四半期ごとに評価レポートを公開し、サンプル解説と反例ライブラリの更新に加え、典型的な成功事例と「失敗事例リスト」を公開する予定です。実際の製品は問題を恐れません。問題を明確に表現することが、しばしば解決策の始まりとなるのです。

結局のところ、このリリースの目的はただ一つ、「会話のリズム」と「対応の論理的思考」を同じ会話に戻し、初日からMetyaの実際のデートシナリオに実装することです。ユーザーが待つ1秒ごとに、誤解は避けられ、気まずいリマインダーは気まずさが和らぎ、関係は前進します。Metya AIラボの責任者は、締めくくりの挨拶で次のように強調しました。「誤解を一つ増やすよりも、論理的思考を一つ増やす方がましです。意思決定がブラックボックスではなくなり、会話が待ち行列に並ぶことがなくなり、言語の壁がなくなると、よりリラックスした出会いがもっと一般的になるでしょう。」

コーネル大学のMetya AIラボについて

Metya AI Labはコーネル大学の研究システムに所属し、「AI + ソーシャル/デート」の基礎研究と製品実装に長年注力してきました。全二重音声、解釈可能なコンテンツ判断、異言語理解、マルチモーダルインタラクションへの継続的な投資により、この分野における研究は着実に進展しています。チームは、オープンで、抑制された、そしてレビュー可能な技術パラダイムを提唱し、実用的なエンジニアリング能力を用いて、真の人間関係の構築と維持に貢献することに尽力しています。

AI
Odaily公式コミュニティへの参加を歓迎します
購読グループ
https://t.me/Odaily_News
チャットグループ
https://t.me/Odaily_CryptoPunk
公式アカウント
https://twitter.com/OdailyChina
チャットグループ
https://t.me/Odaily_CryptoPunk
AI要約
トップに戻る
  • 核心观点:Metya AI发布全双工社交大模型。
  • 关键要素:
    1. 全双工语音,边听边说自然插话。
    2. 可解释内容治理,透明判定依据。
    3. 跨语同传实时对齐,降低交流门槛。
  • 市场影响:提升在线社交体验与信任度。
  • 时效性标注:中期影响。
Odailyプラネットデイリーアプリをダウンロード
一部の人々にまずWeb3.0を理解させよう
IOS
Android