這項由資訊通信媒體發展局在去年11和12月聯合進行的研究,測試了四個人工智慧驅動的大型語言模型,包括我國開發的大型語言模型SEA-LION、Anthropic的聊天機器人Claude、Cohere的Aya以及Meta的Llama。超過300名參與者來自我國、馬來西亞、印度尼西亞、泰國、越南、中國、印度、日本和韓國。
測試結果發現了3222個偏頗答覆,而且,儘管各國有各自獨特的情況,但在性別、地域和社會經濟方面都存在偏見。
比如,這些人工智慧模型認為女性應該成為家庭主婦,男性應該是家庭支柱;農村人的學歷較低。