· 開放式閑聊
閑聊分為匹配式閑聊與生成式閑聊。匹配式閑聊具有Q&A庫,Q&A庫如果足夠大,能達到較好的閑聊效果;生成式閑聊不需要匹配,將根據問題生成答案。
兩項閑聊技術各有優缺點,匹配式閑聊是可控的,通過語料編撰、增加、刪除等方式,可以在語料庫建立時把敏感詞刪除。生成式閑聊的對話有一定的不可控性,比如語料不干凈,就會生成不太健康的內容,同時還會存在語義、語法等問題。
閑聊技術流程圖
閑聊技術可以說是NLP永恒的難題,算法求的是概率,往往缺乏現實的邏輯推理,而機器不知冷暖,單憑文字無法捕獲豐富的情感,這時候就需要借助視覺、語音識別、聲紋信息等技術進行判斷。
· 文本生成
優必選科技的NLP算法不止賦予機器人與人對話的能力,還賦予機器人的寫作能力,吟詩作賦、舞文弄墨不在話下??纯摧斎搿拔沂侵恍∝i歡樂多”,生成的古詩結果竟然還押韻,這是怎么做到的?
通過采用GPT模型,首先定義格式(五言絕句、七言絕句、詞牌等),用分隔符分開,把帶上標點符號的詩詞給到模型,通過語言模型訓練后,就具備生成能力。生成后進行預處理,并定義詩詞的類型,把詩詞的內容拼接起來,把文本向量化輸入到GPT里,一個字、一個字地生成答案。
2025-05-15 18:48
2025-05-15 18:46
2025-05-15 18:45
2025-05-15 18:44
2025-05-15 18:44
2025-05-15 18:43
2025-05-15 18:42
2025-05-15 18:41
2025-05-15 18:40
2025-05-15 18:40