CyberAgent 正式公開DeepSeek-R1-Distill-Qwen-14B/32B 架構的 LLM 模型

日本 CyberAgent 集團在昨天公開了使用日文數據進行增量訓練,基於 DeepSeek-R1-Distill-Qwen-14B/32B 架構的 LLM 模型。

雖然昨晚有個迷因笑稱日本對於 DeepSeek 的話題毫不關心。

image 24 30

但其實日本 CyberAgent 集團(迷錯,就是 GBF & 馬娘的母集團),在昨天公開了使用日文數據進行增量訓練,基於 DeepSeek-R1-Distill-Qwen-14B/32B 架構的 LLM 模型。

它們表示未來也將持續透過開源與產學合作來為日本國內的技術進行貢獻。

而這幾天日本網路社群的反應大致上是這樣:

DeepSeek 登場

它竟然說尖閣諸島(釣魚台)是中國的!

CyberAgent 公開 DeepSeek R1 蒸餾版模型

擔心 CyberAgent 版的回答會與中國立場接近

在沒有 Injection 的狀態下問 DeepSeek R1 關於台灣國家定位問題

不但願意回答,而且比 Copilot 的回覆要來得更仔細 ←現在到這

詳細測試可見以下討論串


吹著魔笛的浮士德
遊戲產業觀察評論家、親子成長的初心者、10 級 Google 地圖嚮導
合作與新聞投稿:[email protected]

追蹤 Instagram:https://lihi3.cc/vlzV5
追蹤 Facebook 專頁:https://www.facebook.com/h9856games