zttofficial
萌典上確實好多地名中文是 ROC 視角,結果英文(及其他外語)用的似乎是 CEDICT 的 API 是 PRC 視角(我估計應該也沒啥 ROC 視角的中英辭典了吧......),莫名的詼諧感。 這就去給唐鳳提issue (
剛才讓 ChatGPT 用重慶話回答問題,既沒説對重慶話,又突然無端將我們一直持續交流的傳統中文文本變成了簡體字,可以想象在它的模型訓練中,即使收集了浩瀚網路的無數資訊,也從未出現一個以傳統中文為載體的重慶話數據集。不由得讓我想起兩年前給萌典提 issue 的事,手工部分唐鳳以 ROC 視角把詞條編纂得很好,但是英文部分偷了個懶用了其他 API,就離譜地變成了 PRC 視角。互聯網成型以來的幾十年,中國人(即簡中使用者)已經把大多數内容都洗了一遍了,全民煉丹,也不外乎拿這些「新鮮」數據煉罷了。於是乎,有了上述兩個故事,似乎重慶話和傳統中文,就是衝突的一對反義詞。但我仍然幸災樂禍,人類社會最複雜的東西就是政治,而我看到 AI 在其門外跌倒的醜樣,獨一無二的還是我嘛。
 
 
Back to Top