聲網母公司第三季總營收3157萬美元持續聚焦RTE+AI技術深耕

2024-11-26 23:25:10來源：雷遞編輯：居小桃

掃一掃

分享文章到微信

掃一掃

關注鹿財經網微信公眾號

　　原標題：聲網母公司第三季總營收3157萬美元持續聚焦RTE+AI技術深耕

　　聲網母公司Agora,Inc.(NASDAQ:API)今日發布了2024年第三季度財報。財報顯示，第三季度Agora,Inc.實現總營收3157萬美元，其中，業務聚焦在中國市場的聲網實現Q3營收1.13億人民幣。聚焦非中國市場的Agora實現Q3營收1570萬美元。

　　在資金儲備方面，財報顯示截至2024年9月30日，Agora,Inc.現金、現金等價物、銀行存款及理財產品3.63億美元。

　　“近期，Agora推出了Conversational AI SDK，并與OpenAI Realtime API合作，讓開發者能夠在任何應用程序中加入語音驅動的對話式AI能力。”Agora,Inc.創始人兼CEO趙斌表示，“我們相信，能以語音與人類進行自然對話的多模態AI將在客戶服務、教育和健康等多個場景中得到廣泛應用，而我們有望成為對話式AI的關鍵基礎設施。”

　　趙斌說，“為了支持這一愿景，我們進行了一些組織調整，旨在打造一個更高效、更靈活的組織，讓我們能更敏捷的抓住市場機遇，并打造生成式AI時代的下一代實時互動技術，鞏固我們在實時互動領域的領導地位。”

　　虧損擴大的背后是計入一次性費用支出

　　財報顯示，聲網本季度凈虧損約2400萬美元，同比擴大約7%。虧損擴大的背后主要是由于取消員工期權、減記少數股權投資等與實際業務運營不相關的一次性費用支出，如不考慮此類因素，當季凈虧損約390萬美元。

　　其中，針對取消員工期權產生的1140萬美元費用，聲網CFO王靜波在業績電話會上解釋，“該部分期權在2021年股價較高時授予，會計成本很高，但由于股價下跌，激勵作用不強。按照美國會計準則的規定，雖然期權被取消，員工并未得到任何收益，公司也未付出任何現金或股份發行等成本，公司仍然要在當季一次性計入這些期權未來所有的費用，取消后，未來這部分費用就沒有了。”

　　RTE成AI Infra關鍵部分，聲網發布RTE+AI能力全景圖

　　在10月25日舉辦的第十屆實時互聯網大會上，聲網正式發布了RTE+AI能力全景圖，從實時AI基礎設施、RTE+AI生態能力、聲網AI Agent、實時多模態對話式AI解決方案、RTE+AI應用場景五個維度，清晰呈現了當下RTE與AI相結合的技術能力、架構方案與應用場景。

　　RTE已經成為生成式AI時代AI基礎設施的關鍵部分，而RTE與生成式AI結合所帶來的場景創新，也將成為下一個十年的主題。

　　幾年前，聲網在業內首次將 AI 算法全面引入 RTC 技術棧的各個領域，用于改善音視頻體驗與 QoE 體驗。在音頻領域，聲網打造了新一代實時音頻技術智能引擎“鳳鳴AI引擎”，其中的 AI 降噪、AI 回聲消除、空間音頻等能力給實時互動場景帶來了更加純凈和沉浸的聽覺體驗。在視頻領域，聲網的“實時高清·超級畫質”解決方案，在全面提升視頻畫質的同時，也帶來了 AI 美顏、虛擬背景、AI 驅動表情與動作等方面的體驗進化。

　　生成式 AI 正在向多模態和多步推理兩個方向深度進化。其中，多步推理對于延遲降低和可用性的穩定保障成為關鍵需求。聲網首創了迄今為止規模最大的實時音視頻網絡——軟件定義實時網SD-RTN™。SD-RTN™ 將為分布式多步推理的延遲控制提供重要保障。其對傳輸質量的保證以及穩定可靠的支持，也將在生成式 AI 時代成為不可或缺的網絡基礎設施。

　　在基礎設施之上，本季度聲網通過與多家客戶在 AIGC 場景的深度合作，探索出了實時多模態對話式 AI 解決方案，該方案以語音為核心，支持視頻擴展，可實現文本/音頻/圖像/視頻的組合輸入&輸出，通過豐富的功能構建真實、自然的 AI 語音交互體驗。

　　實時多模態對話式 AI 解決方案具備四大優勢：對交互延遲進行優化，延遲可做到低于500ms；支持 AI 降噪、背景人聲過濾，讓語音對話更純靜；支持隨時打斷與超擬人化人聲合成，讓對話更智能與逼真；同時還支持靈活可擴展的 AI Agent 架構等一系列功能，幫助開發者與企業快速構建適配自己業務場景的 AI 實時語音對話服務。

　　創新AI+會議協作、智能硬件場景，互動體驗全面升級

　　聲網一直在探索生成式 AI 與 RTE 結合為各個行業帶來的體驗提升和場景創新。本季度，聲網正式發布了 aPaaS 產品“靈動會議”，通過 RTE 技術與生成式 AI 能力的融合，重塑會議協作使用體驗，為客戶提供低代碼視頻會議平臺，并且采用了多云、多平臺設計，提供 SFU+MCU 混合架構部署能力，支持客戶進行靈活部署和擴展，全面滿足客戶會議、協作和調度需求。

　　RTE 技術確保了低延遲、高質量的音視頻傳輸，讓視頻會議溝通更加實時流暢；而生成式 AI 則通過對會議內容的分析和生成，提供智能化的輔助功能，如實時字幕、AI 會議紀要等。兩大技術支撐，讓會議從傳統的信息傳輸工具升級為智能協作平臺，有效提升了會議效率和用戶體驗。

　　除此之外，在實時多模態對話式 AI 解決方案的基礎上，聲網針對 IoT 行業的特殊性，探索出了 AI x IoT 智能硬件解決方案，該方案能夠在低功耗、低算力芯片上快速實現大模型的接入，具備低延時實時互動、低成本靈活適配的特性，通過豐富的功能在智能硬件場景中構建真實、自然的 AI 語音交互體驗。

　　目前多模態大模型在智能硬件場景的落地主要以智能眼鏡、智能手表、智能耳機等穿戴式設備為主，在生成式 AI 的趨勢下，還出現了智能陪伴機器人、智能兒童毛絨玩具、智能戒指等一系列場景，帶來不同硬件終端下的 AI 語音交互體驗。

　　RTE 產品更加專業化，推出Status Page、VoIP CallKit

　　本季度，聲網的 RTE 產品也正朝著更加專業化的方向邁進。趙斌在 RTE2024 的演講中提到，聲網推出了面向實時互動的 Status Page，它提供了電信級質量保證，擁有分鐘級更新質量保證狀態的能力。同時，針對實時互動對話中的卡頓、延遲等體驗，提供更加細致且清晰的指標，幫助開發者和客戶更好地對實時互動服務狀態和能力進行感知。

　　針對泛 IPC 場景中，用戶接通率普遍較低這一痛點，聲網在近期推出了小程序 VoIP CallKit，該方案基于聲網 RTSA 音視頻實時通話服務，可支持微信小程序 VoIP 端到端呼叫功能?？蛇m用于帶屏 IPC、智能門鎖、陪伴機器人、智能可視臺燈、智能手表、智能帶屏音箱等一系列 IoT 場景。在這些場景中，接入 VoIP CallKit 能夠高效、快速、準確地實現智能硬件與微信小程序之間的 1v1 實時音視頻通話。

　　今年8月，中國首款 3A 游戲“黑神話：悟空” 的推出使得游戲開黑業務呈現爆發式增長，為了吸引更多觀眾參與，直播時的畫質成為直播平臺和主播都非常關注的因素。聲網的游戲直播方案，通過對采集和編碼側的核心技術優化，在游戲屏幕共享過程中，保證實時視頻編碼，讓性能消耗最低、編碼效率最高，最終實現不掉幀、無卡頓、低延時、超高清的游戲直播互動體驗，可以真正做到把大片級 4K 60幀觀看體驗搬到普通玩家的日常游戲直播中。

　　聲網研究院出品，《讀懂實時互動》新書發布

　　今年是聲網成立10周年，聲網稱，公司一直以“幫助人們跨越距離實時互動，如聚一堂”為使命，致力于通過高質量的實時音視頻技術服務，全面提升人們的實時互動體驗，為社交、教育、金融、醫療等行業賦能，推動經濟、社會的發展。聲網有責任也有義務去推動實時互動的普及。

　　對此，聲網在10周年之際推出《讀懂實時互動：音視頻技術、場景及數據深度解讀》一書。本書由機械工業出版社出版，聲網研究院組編，于8月27日正式發售上架，這也是全行業首本系統介紹實時互動的技術型科普圖書?！蹲x懂實時互動》從發展歷程、技術原理、應用場景、大數據觀察等多個維度對實時互動行業展開全面的系統性講解。

投稿郵箱：lukejiwang@163.com 詳情訪問鹿財經網：http://m.cqpengren.com