語言模型 | Page 3

| LaMDA | google | 語言模型

說AI有感知能力的Google工程師被解僱了

Google表示，被開除的工程師Blake Lemoine宣稱LaMDA模型有感知能力一事毫無根據，在雙方溝通無效、Lemoine依舊選擇違反公司政策情況下，選擇解僱Lemoine

2022-07-25

具備1,760億個參數的語言模型BLOOM開源了

由AI新創Hugging Face主導並協調的BigScience專案，釋出具備1,760億個參數的大型語言模型BLOOM，其參數規模略勝OpenAI的GPT-3模型

2022-07-14

| YaLM 100B | Yandex | 開源 | 語言模型

Yandex開源具備1,000億個參數的YaLM 100B語言模型

Yandex強調YaLM 100B是全球最大的類生成型已訓練變換模型（GPT）的神經網路

2022-06-24

| Meta | Open Pretrained Transformer | OPT-175B | 語言模型

Meta釋出具備1,750億個參數的Open Pretrained Transformer語言模型

OPT-175B語言模型所使用的參數數量，與號稱全球最強大語言模型的OpenAI GPT-3一樣多，不過，Meta強調它們只使用了16個Nvidia的V100 GPU就完成該模型的訓練與部署

2022-05-04

| OpenAI | 語言模型 | GPT-3 | Codex

語言模型GPT-3現新增文字編輯和插入功能

語言模型GPT-3現在可以參考文字前後段落，插入連結兩段落的文字，或是修改現有內容的語氣和結構

2022-03-16

| Deepmind | AI | 紅隊 | 語言模型

Deepmind以紅隊模型自動化探索語言模型的有害行為

Deepmind利用紅隊語言模型來生成測試使用案例，以自動發現語言模型的各種有害行為

2022-02-08

| google | AI | 語言模型 | MoE

Google讓模型依任務學習路由，有效提高大型語言模型推理效率

Google發表新的新型混合專家模型TaskMoE，大小不只是典型混合專家模型TaskMoE的七分之一，吞吐量更是提升達2倍

2022-01-18

AI趨勢周報第182期：吳恩達看2022年AI趨勢：多模態AI起飛

吳恩達提出2022年AI趨勢預測，多模態AI將起飛、參數破兆模型會更多、AI生成音檔將成主流；理解力媲美高中生！DeepMind無心插柳柳成蔭，造出超大語言模型Gopher；微軟用Transformer打造通吃多種CV任務的多模態AI，還用來優化Azure認知服務；阿里達摩院發表2022年科技趨勢預測：綠能AI崛起

2021-12-30