Yupp種子輪攬3,300萬美元,推特前技術骨幹重建AI模式評估體系

avatar
Foresight News
11小時前
本文約3021字,閱讀全文需要約4分鐘
a16z crypto領投,Google首席科學家Jeff Dean、X聯合創始人Biz Stone參投,Yupp如何用眾包模式撕開AI普惠和評估的突破口?

原文作者:KarenZ,Foresight News

隨著AI 技術的快速發展,AI 模型的層出不窮和多樣化讓使用者眼花撩亂。如何選擇適合自己的AI 模型,除傳統基準測試外如何讓模型精準捕捉真實需求、如何為反饋用戶提供實打實的激勵,成為AI 行業亟待突破的關鍵命題。

Yupp 正是在這一背景下誕生的開放型平台,旨在建立一個開放、透明、社群驅動的AI 模式評估平台。正如Yupp 所說,「與歷史上任何其他技術創新相比,AI 更依賴於每個人的參與和貢獻來推動演化。」

上週(6 月13 日),Yupp.ai 宣布了a16z crypto 領投的3300 萬美元種子輪融資,同時谷歌首席科學家Jeff Dean、X 聯合創始人Biz Stone 等豪華投資人陣營吸引了社區的目光。同時,Yupp 也推出了其產品,不僅為用戶提供了一個探索AI 的窗口,更透過社群參與和區塊鏈技術重新定義了AI 模型的評估與優化方式。

Yupp 團隊和融資背景

Yupp 背後公司為Ber Sarai Labs Inc.,由Pankaj Gupta 和Gilad Mishne 兩位聯合創始人於2024 年6 月共同創立,在過去6 個月一直在秘密進行測試。 Yupp 兩位共同創辦人和首席科學家於2010 年在推特相識,兩人皆擁有深厚的AI 產業背景,曾在Coinbase、Google、X 等公司工作。

  • Pankaj Gupta:Yupp 聯合創始人兼CEO,擁有印度理工學院德里分校計算機科學和工程學士學位、斯坦福大學大學計算機科學博士學位,曾在推特擔任技術主管、個性化和推薦高級經理、ML 高級職員(2009 年3 月-2014 年5 月),在谷歌先後擔任工程總監和高級工程總監(2017 年一號員工和站點負責人,之後在Coinbase 擔任工程副總裁和顧問(2021 年4 月-2024 年5 月)。

  • Gilad Mishne:Yupp 聯合創始人兼AI 主管,曾在英特爾擔任軟體工程師(1998 年-2000 年),在雅虎擔任過高級科學家(2017-2010),在推特擔任高級工程師和搜尋總監(Google登月

  • Jimmy Lin:Yupp 首席科學家,在麻省理工大學攻讀電腦科學博士期間研究問答系統和對話介面,目前在滑鐵盧大學David R. Cheriton 電腦科學學院擔任教授和David R. Cheriton 主席。 2010 年至2012 年, Jimmy Lin 在推特參與數據分析和數據科學的基礎建設。

本月Yupp 官方宣布的3,300 萬種子輪融資已於去年完成。 Yupp 資本矩陣涵蓋技術、投資與學術領域,除了領投方a16z crypto 之外,谷歌首席科學家Jeff Dean、X 聯合創始人Biz Stone、Pinterest 聯合創始人Evan Sharp、 Perplexity 首席執行官Aravind Srinivas、 Cred 首席執行官Kunal Shah、史丹佛大學的四位教授(DanPauleh、Chris Res、NickPauleh、Chris Rei Raja) Ventures 亦參與其中。

Yupp 是什麼?如何運作?

Yupp 定位為AI 模型探索和評估平台,允許用戶免費體驗和比較各種AI 模型,其核心理念是透過眾包的方式進行模型評估:用戶提交提示詞,對比不同AI 模型生成的回复,並給出較優答案和給出評定反饋,同時得到可兌現的積分激勵。這些選擇和回饋會被記錄下來,形成用於AI 模型後期訓練和評估的數據。

Yupp 還將利用區塊鏈等開放存取和無需許可的技術、零知識證明和挑戰/ 響應機制等密碼學原語和協議,以及機密計算等隱私保護技術,構建具有可證明的可信中立性、公平性和穩健性的系統。

Yupp 的運作機制可以歸納為以下幾點:

1.模型探索和對比: Yupp 匯集了超500 個AI 模型,包括ChatGPT、Claude、Gemini、DeepSeek、Grok、Llama 等。使用者可以在平台聊天頁面找到各種AI 模型,並進行Prompt 測試,直覺並排比較它們的優劣。

Yupp 目前有聊天頁面和排行榜兩個頁面,其中,聊天頁面設計較為簡單,有訊息框、檔案上傳功能、模型選擇功能(可選)、圖片上傳功能、聊天私密和公開模式切換(預設私密)。

Yupp種子輪攬3,300萬美元,推特前技術骨幹重建AI模式評估體系

如下圖所示,提問後,Yupp 會給予兩個AI 的回答版本,然後使用者選出較優版本。

Yupp種子輪攬3,300萬美元,推特前技術骨幹重建AI模式評估體系

值得一提的是,提問時模型預設自動選擇,有時還會隱藏掉模型名稱以收集更客觀的回饋,當然,使用者也可以隨機提問。此外,Yupp 的QuickTake AI 功能還可以提供簡短總結回應。

2.使用者回饋:使用者在選出較優答案後,可以進一步透過點擊標籤回饋答案的優劣偏好,也可以用文字自由闡述。這些回饋將幫助用戶自訂未來在Yupp 上的AI 答案,也讓Yupp 能夠免費提供模型。

3.回饋獎勵:給予回饋後,使用者會得到一個積分刮刮卡。積分可用於提問或兌現。

Yupp種子輪攬3,300萬美元,推特前技術骨幹重建AI模式評估體系

4.評估:使用者透過選擇的最佳回覆和提供的回饋,參與模型的評估過程。 Yupp 旨在建立一個公開透明的評估體系,讓AI 開發者可以獲得有價值的訓練數據,使用者可以獲得獎勵,共同推動AI 技術的發展。 Yupp 平台具有一個名為“Yupp VIBE Score”(VIBE,Vibe Intelligence BEnchmark)的公開排行榜,旨在利用用戶反饋來改進模型性能,同時保證用戶Prompt 的私密性,除非用戶選擇共享。

Yupp 會根據使用者回饋以及反應等因素制定一個排行榜。在排行榜中,可以按濾鏡對平台上整合的AI 模型進行排序,維度包括VIBE 評分、機率樣本的置信區間、投票情況、速度、延遲、輸入/ 輸出成本。

Yupp種子輪攬3,300萬美元,推特前技術骨幹重建AI模式評估體系

Yupp 的AI 模型評估會結合使用者的偏好數據,以更細微的方式對使用者和評估數據進行細分,從而為AI 開發者提供樣本。 Yupp 表示,憑藉團隊創辦人在Twitter 上應對垃圾資訊和機器人問題的經驗,開發了複雜的演算法來剔除低品質數據,確保排名的完整性。 Yupp 也組建了專門的信任與安全團隊,並將繼續在該領域投入大量資金。

Yupp種子輪攬3,300萬美元,推特前技術骨幹重建AI模式評估體系

Yupp 積分體系:消耗與兌現的平衡規則

Yupp 積分靠提問消耗、靠回饋賺取,部分可以兌現。 Yupp 表示,如果使用者負責任地使用Yupp,將始終擁有足夠的積分提問AI 模型,並且還可以兌現一部分積分,以表示對改善生態系統狀況的感激。

提問需花費積分,初始註冊後可免費獲得5000 積分。另外,總費用為預設費用、PRO 模型費用、附件提交費用、預選圖片模型費用總和。

  • 基本費用: 每個提示詞預設花費50 點。如果產生影像,則費用為100 Yupp 積分。

  • PRO 模型: 這些高級模型,僅在其他平台透過付費訂閱提供。如果使用者預先選擇PRO 模型,則每次提問需額外花費50 個Yupp 積分。

  • MAX 模型: 這些模型是使用最昂貴的模型。如果使用者預先選擇MAX 模型,則每個模型每個提示詞需額外花費300 Yupp 積分(含基礎費用共350 點)。

  • 附件提交費用:每個附件需要花費25 個Yupp 積分。

  • 選擇影像模型: 每個預選影像模型需額外花費100 個Yupp 積分。

此外,Yupp 問答預設私密,如果使用者選擇公開問答,只需支付上述常規費用的一半。

如前所述,回饋模型可以賺取積分刮刮卡。筆者得到的幾個積分刮刮卡在200 到500 點之間。

Yupp 表示,用戶可以將積分提現,換成美元、歐元、印度盧比及其他20 多種貨幣,或兌換成穩定幣(基於Base 和Solana)。 Yupp 也與Stripe、Paypal 和Coinbase 等支付服務提供者建立了合作關係,以滿足用戶的不同需求。每1000 積分可以兌換1 美元。不過兌現功能目前無法使用。為了規避女巫或濫用行為,Yupp 也設定了積分兌現規則:

  • 每日提款次數最多1 次,提款上限為10 美元(1 萬積分);

  • 每週提款次數最多3 次,總提款上限為20 美元(2 萬積分);

  • 每月提款次數最多6 次,總提款上限為50 美元(5 萬積分)。

另外,Yupp 規定,購買、出售、交易或轉讓Yupp 積分等此類交易違反服務條款,均視為無效,並可能導致帳戶立即停用。濫用可能會導致產品功能被停用,甚至暫停帳戶。

如何參與?

Yupp 參與流程如下:

  • 用Google帳號登入註冊(註冊獲得5000 積分,官方表示6 月20 日之前用「yupp-launch」code 可額外獲得2500 積分);

  • 提問AI 模型,在兩個AI 模型中選擇較優答案;

  • 選擇回饋標籤或提供文字回饋。

  • 用滑鼠刮積分刮刮卡領取積分。

  • 自行決定是否提款(目前官方已暫時關掉提款)。

小結

正如a16z crypto 創始人和執行合夥人Chris Dixon 表示,「Yupp 的設計將人類的判斷轉化為可持續的經濟資源。隨著新的互動取代舊的數據,數據「過期」,形成了一個自然的良性循環:更多的使用帶來更新的評估;更新的評估產生更好的模型;更好的模型吸引更多的使用。所有參與者——從使用者到AI 模型建構者——都可以參與其中,並看到相同的透明規則適用於每個人,確保了一個可信賴的中立市場。沒有人可以隱藏排行榜,也沒有人可以操縱獎勵或結果。 」

Yupp 的口號「Every AI for everyone」,筆者認為譯為「普惠AI」較為貼切。 Yupp 試圖透過區塊鏈技術與眾包模式,建構AI 時代的「評估基礎設施」:讓用戶透過回饋獲得激勵,讓開發者獲取真實數據,最終推動AI 技術朝向更普惠、更可信的方向進化。

參考:

https://www.wired.com/story/yupp-chatbot-pays-users-ai-model-feedback/

https://yupp.ai/help

https://blog.yupp.ai/launch

https://blog.yupp.ai/leaderboard

原創文章,作者:Foresight News。轉載/內容合作/尋求報導請聯系 report@odaily.email;違規轉載法律必究。

ODAILY提醒,請廣大讀者樹立正確的貨幣觀念和投資理念,理性看待區塊鏈,切實提高風險意識; 對發現的違法犯罪線索,可積極向有關部門舉報反映。

推薦閱讀
星球精選