數據開源 | 高質量雙工自然對話中文語音數據集,引領AI實時交互新體驗

      2025-01-15

      來源:互聯網

      在快速發展的人工智能領域,技術突破與用戶體驗提升正引領著語音對話模型邁向新的高度。從最初的簡單問答到如今復雜多變的對話場景,人機交互正經歷著前所未有的深刻變革。傳統的訓練數據已難以適應當前的需求,現代交互要求系統不僅能理解語言的上下文,還需快速識別用戶的需求并作出恰當反饋。

      在此背景下,晴數智慧聯合中國科學院聲學研究所,共同開源了“雙工自然對話語音數據集_中文”,為語音對話模型提供更加真實、細膩的訓練數據。通過對每位說話者語音的獨立分析,該數據集讓語音對話模型能夠洞察對話中的上下文變化、語調起伏以及情感波動,從而生成更加自然、準確的回應。同時,雙工分離數據讓端到端模型的構建更為精準,反饋速度更快。

      數據集描述

      晴數智慧開發的多通道自然對話語音數據集,旨在解決當前語音對話模型面臨的兩大問題:一是如何在復雜對話環境中準確捕捉并區分每位說話者的語音信息;二是如何使AI模型更好地理解并適應自然對話中的打斷、交互等動態過程。

      上圖為雙工語音交互模型架構圖。雙工語音交互模型(如 dGSLM [1]、Moshi [2]和SLIDE [3])突破了傳統單工語音交互模型一問一答的僵化響應模式,實現了同步聽說以及在交互過程中自然的打斷與插話。然而,這些模型的訓練高度依賴雙工自然對話語音數據。而此類數據的稀缺,尤其是在中文領域,嚴重限制了上述模型的性能提升。

      為解決這些問題,我們采取了創新的數據采集與處理策略。首先,通過獨立采集每位說話者的音軌,并單獨對每個說話人做分類標注,完整的保留了對話過程中自然的打斷,交互等過程。其次,通過將每位說話者的音頻分離,我們能夠提供更清晰、更精準的訓練數據,使模型更專注于理解和響應自然說話的交互過程。

      為了讓大家更直觀地了解我們的多通道數據,我們特別選取了5小時的對話內容作為本次開源數據集。本數據可以用于模型的微調或者測試使用(非商用)。

      數據集優勢與亮點

      自然度:捕捉真實場景下的自然對話,確保數據的高度自然流暢;

      領域多樣性:覆蓋多個行業與話題,滿足跨領域應用需求;

      地域多樣性:融入不同地域的語音特征,增強模型的泛化能力;

      副語言標簽:特別標注副語言信息,如語氣、停頓等,為深度情感分析與交互體驗升級提供有力支持。

      除了中文雙工對話數據開源之外,我們同樣開源了英語雙工對話數據,對英語雙工數據感興趣的朋友,歡迎通過以下鏈接下載并使用,探索更多可能~



      更多新聞
      火山引擎×上汽集團:共建汽車全場景AI新體驗

      火山引擎×上汽集團:共建汽車全場景AI新體驗

      Moka AI 探索實踐:七年技術深耕,從單點突破到招聘全流程閉環

      Moka AI 探索實踐:七年技術深耕,從單點突破到招聘全流程閉環

      2025快手磁力大會:加速“生成新商業”,AI全面重塑商業經營

      2025快手磁力大會:加速“生成新商業”,AI全面重塑商業經營

      日韩精品无码一本二本三本| 免费VA在线观看无码| 最近更新中文字幕在线| 日韩av无码免费播放| 成年午夜无码av片在线观看| 最近中文字幕完整版免费高清| 国产午夜无码精品免费看| 最近中文字幕高清中文字幕无| 少妇人妻无码专区视频| 天堂а在线中文在线新版| 亚欧免费无码aⅴ在线观看| 最近中文字幕大全中文字幕免费 | 中文字幕精品一区二区精品| 成人免费无码H在线观看不卡| 亚洲精品午夜无码电影网| 最近完整中文字幕2019电影| 狠狠精品久久久无码中文字幕| 4hu亚洲人成人无码网www电影首页| 亚洲AV无码久久精品色欲| 韩日美无码精品无码| 熟妇人妻无乱码中文字幕真矢织江| 中文字幕一区二区人妻性色| 一本大道东京热无码一区| 日韩AV无码中文无码不卡电影| 亚洲.欧美.中文字幕在线观看| 人妻无码中文字幕免费视频蜜桃| 免费无码中文字幕A级毛片| 亚洲精品~无码抽插| 亚洲一区二区三区AV无码| 中文字幕乱偷无码AV先锋| 无码av人妻一区二区三区四区 | 四虎影视无码永久免费| 天堂中文8资源在线8| 熟妇人妻无乱码中文字幕真矢织江| 日本中文字幕在线2020| 色综合久久中文色婷婷| 中文字幕一区二区精品区| 中文字幕手机在线视频| 亚洲欧洲中文日韩久久AV乱码| 日本在线中文字幕第一视频| 人妻丰满熟妇aⅴ无码|