AI時代

Moshi AI : AI 語音助理, ChatGPT 新對手

法國人工智能研究實驗室 Kyutai 推出 Moshi AI ,這是一款新的「即時」AI語音助理,可能是GPT-4o在語音肋理方面的強大對手?而且計劃在未來幾週內開源其研究和模型,Moshi 將透過 Hugging Face 平台進行試用。

Moshi AI 是一個名為 Helium 的7B 參數多模態模型,經過文本和音頻編解碼器的訓練。它可以在Nvidia GPU、蘋果的𝑀或CPU上運行,提供原生的語音輸入和輸出功能。未來想通過社區支持來增強Moshi AI的知識庫和事實準確性。未來的更新將專注於優化模型並擴大規模,以支持更複雜和更長時間的對話。

雖然Moshi AI提供了與GP4-4o相似的核心功能,但它是一個更小的模型,可以在本地運行。GPT-4o的高級語音功能尚未廣泛可用,這使得Moshi AI成為開源AI開發的進步。

Moshi 預定應用場景

1.家居管理:安排提醒、創建購物清單、控制家用設備。

2.工作效率:在會議中發送緊急郵件,或不中斷工作流程安排視訊會議。

3.老年人或殘障人士協助:Moshi 可協助日常任務、提醒服藥等。

4.娛樂與生活方式:播放音樂和播客、搜尋食譜、預約等。

5.教育與學習:協助作業、學習新語言等。

資料來源:https://moshi-ai.com/

TechApple.com 編輯部

堅持製作專業科技內容,全員擁有多種不同技術知識的特異科技媒體團隊。 電郵:editor@techapple.com