聲網母公司第三季總營收3157萬美元 持續聚焦RTE+AI技術深耕
原標題:聲網母公司第三季總營收3157萬美元 持續聚焦RTE+AI技術深耕
聲網母公司Agora,Inc.(NASDAQ:API)今日發布了2024年第三季度財報。財報顯示,第三季度Agora,Inc.實現總營收3157萬美元,其中,業務聚焦在中國市場的聲網實現Q3營收1.13億人民幣。聚焦非中國市場的Agora實現Q3營收1570萬美元。
在資金儲備方面,財報顯示截至2024年9月30日,Agora,Inc.現金、現金等價物、銀行存款及理財產品3.63億美元。
“近期,Agora推出了Conversational AI SDK,并與OpenAI Realtime API合作,讓開發者能夠在任何應用程序中加入語音驅動的對話式AI能力。”Agora,Inc.創始人兼CEO趙斌表示,“我們相信,能以語音與人類進行自然對話的多模態AI將在客戶服務、教育和健康等多個場景中得到廣泛應用,而我們有望成為對話式AI的關鍵基礎設施。”
趙斌說,“為了支持這一愿景,我們進行了一些組織調整,旨在打造一個更高效、更靈活的組織,讓我們能更敏捷的抓住市場機遇,并打造生成式AI時代的下一代實時互動技術,鞏固我們在實時互動領域的領導地位。”
虧損擴大的背后是計入一次性費用支出
財報顯示,聲網本季度凈虧損約2400萬美元,同比擴大約7%。虧損擴大的背后主要是由于取消員工期權、減記少數股權投資等與實際業務運營不相關的一次性費用支出,如不考慮此類因素,當季凈虧損約390萬美元。
其中,針對取消員工期權產生的1140萬美元費用,聲網CFO王靜波在業績電話會上解釋,“該部分期權在2021年股價較高時授予,會計成本很高,但由于股價下跌,激勵作用不強。按照美國會計準則的規定,雖然期權被取消,員工并未得到任何收益,公司也未付出任何現金或股份發行等成本,公司仍然要在當季一次性計入這些期權未來所有的費用,取消后,未來這部分費用就沒有了。”
RTE成AI Infra關鍵部分,聲網發布RTE+AI能力全景圖
在10月25日舉辦的第十屆實時互聯網大會上,聲網正式發布了RTE+AI能力全景圖,從實時AI基礎設施、RTE+AI生態能力、聲網AI Agent、實時多模態對話式AI解決方案、RTE+AI應用場景五個維度,清晰呈現了當下RTE與AI相結合的技術能力、架構方案與應用場景。
RTE已經成為生成式AI時代AI基礎設施的關鍵部分,而RTE與生成式AI結合所帶來的場景創新,也將成為下一個十年的主題。

幾年前,聲網在業內首次將 AI 算法全面引入 RTC 技術棧的各個領域,用于改善音視頻體驗與 QoE 體驗。在音頻領域,聲網打造了新一代實時音頻技術智能引擎“鳳鳴AI引擎”,其中的 AI 降噪、AI 回聲消除、空間音頻等能力給實時互動場景帶來了更加純凈和沉浸的聽覺體驗。在視頻領域,聲網的“實時高清·超級畫質”解決方案,在全面提升視頻畫質的同時,也帶來了 AI 美顏、虛擬背景、AI 驅動表情與動作等方面的體驗進化。
生成式 AI 正在向多模態和多步推理兩個方向深度進化。其中,多步推理對于延遲降低和可用性的穩定保障成為關鍵需求。聲網首創了迄今為止規模最大的實時音視頻網絡——軟件定義實時網SD-RTN™。SD-RTN™ 將為分布式多步推理的延遲控制提供重要保障。其對傳輸質量的保證以及穩定可靠的支持,也將在生成式 AI 時代成為不可或缺的網絡基礎設施。
在基礎設施之上,本季度聲網通過與多家客戶在 AIGC 場景的深度合作,探索出了實時多模態對話式 AI 解決方案,該方案以語音為核心,支持視頻擴展,可實現文本/音頻/圖像/視頻的組合輸入&輸出,通過豐富的功能構建真實、自然的 AI 語音交互體驗。

實時多模態對話式 AI 解決方案具備四大優勢:對交互延遲進行優化,延遲可做到低于500ms;支持 AI 降噪、背景人聲過濾,讓語音對話更純靜;支持隨時打斷與超擬人化人聲合成,讓對話更智能與逼真;同時還支持靈活可擴展的 AI Agent 架構等一系列功能,幫助開發者與企業快速構建適配自己業務場景的 AI 實時語音對話服務。
創新AI+會議協作、智能硬件場景,互動體驗全面升級
聲網一直在探索生成式 AI 與 RTE 結合為各個行業帶來的體驗提升和場景創新。本季度,聲網正式發布了 aPaaS 產品“靈動會議”,通過 RTE 技術與生成式 AI 能力的融合,重塑會議協作使用體驗,為客戶提供低代碼視頻會議平臺,并且采用了多云、多平臺設計,提供 SFU+MCU 混合架構部署能力,支持客戶進行靈活部署和擴展,全面滿足客戶會議、協作和調度需求。

RTE 技術確保了低延遲、高質量的音視頻傳輸,讓視頻會議溝通更加實時流暢;而生成式 AI 則通過對會議內容的分析和生成,提供智能化的輔助功能,如實時字幕、AI 會議紀要等。兩大技術支撐,讓會議從傳統的信息傳輸工具升級為智能協作平臺,有效提升了會議效率和用戶體驗。
除此之外,在實時多模態對話式 AI 解決方案的基礎上,聲網針對 IoT 行業的特殊性,探索出了 AI x IoT 智能硬件解決方案,該方案能夠在低功耗、低算力芯片上快速實現大模型的接入,具備低延時實時互動、低成本靈活適配的特性,通過豐富的功能在智能硬件場景中構建真實、自然的 AI 語音交互體驗。
目前多模態大模型在智能硬件場景的落地主要以智能眼鏡、智能手表、智能耳機等穿戴式設備為主,在生成式 AI 的趨勢下,還出現了智能陪伴機器人、智能兒童毛絨玩具、智能戒指等一系列場景,帶來不同硬件終端下的 AI 語音交互體驗。
RTE 產品更加專業化,推出Status Page、VoIP CallKit
本季度,聲網的 RTE 產品也正朝著更加專業化的方向邁進。趙斌在 RTE2024 的演講中提到,聲網推出了面向實時互動的 Status Page,它提供了電信級質量保證,擁有分鐘級更新質量保證狀態的能力。同時,針對實時互動對話中的卡頓、延遲等體驗,提供更加細致且清晰的指標,幫助開發者和客戶更好地對實時互動服務狀態和能力進行感知。
針對泛 IPC 場景中,用戶接通率普遍較低這一痛點,聲網在近期推出了小程序 VoIP CallKit,該方案基于聲網 RTSA 音視頻實時通話服務,可支持微信小程序 VoIP 端到端呼叫功能??蛇m用于帶屏 IPC、智能門鎖、陪伴機器人、智能可視臺燈、智能手表、智能帶屏音箱等一系列 IoT 場景。 在這些場景中,接入 VoIP CallKit 能夠高效、快速、準確地實現智能硬件與微信小程序之間的 1v1 實時音視頻通話。
今年8月,中國首款 3A 游戲“黑神話:悟空” 的推出使得游戲開黑業務呈現爆發式增長,為了吸引更多觀眾參與,直播時的畫質成為直播平臺和主播都非常關注的因素。聲網的游戲直播方案,通過對采集和編碼側的核心技術優化,在游戲屏幕共享過程中,保證實時視頻編碼,讓性能消耗最低、編碼效率最高,最終實現不掉幀、無卡頓、低延時、超高清的游戲直播互動體驗,可以真正做到把大片級 4K 60幀觀看體驗搬到普通玩家的日常游戲直播中。
聲網研究院出品,《讀懂實時互動》新書發布
今年是聲網成立10周年,聲網稱,公司一直以“幫助人們跨越距離實時互動,如聚一堂”為使命,致力于通過高質量的實時音視頻技術服務,全面提升人們的實時互動體驗,為社交、教育、金融、醫療等行業賦能,推動經濟、社會的發展。聲網有責任也有義務去推動實時互動的普及。
對此,聲網在10周年之際推出《讀懂實時互動:音視頻技術、場景及數據深度解讀》一書。本書由機械工業出版社出版,聲網研究院組編,于8月27日正式發售上架,這也是全行業首本系統介紹實時互動的技術型科普圖書?!蹲x懂實時互動》從發展歷程、技術原理、應用場景、大數據觀察等多個維度對實時互動行業展開全面的系統性講解。
投稿郵箱:lukejiwang@163.com 詳情訪問鹿財經網:http://m.cqpengren.com


























