| Hugging Face | 多模態模型 | SmolVLM-256M | SmolVLM-500M

Hugging Face釋出號稱業界最小多模態語言模型,推論單一圖片不用1GB RAM

Hugging Face公布多模態模型家族SmolVLM新成員,其中規模最小的SmolVLM-256M,強調以不到1GB的GPU RAM就能在單一圖片上執行推論

2025-01-26

| 微軟 | Hugging Face | Phi-4

微軟以MIT授權在Hugging Face開源140億參數Phi-4模型

微軟以MIT授權開源僅140億參數的Phi-4模型,性能超越同級甚至部分大型模型,在科學與數學領域表現亮眼,其精簡架構使其運算量低,更適合行動與邊緣應用

2025-01-10

| IT周報 | Hugging Face | BERT | 序列 | LLM | google | 分詞 | Meta | 超高速顯微鏡

AI趨勢周報第265期:BERT的接班模型來了

Hugging Face聯手其他團隊開發ModernBERT模型;Google推出LLM事實基準測試和排行榜;Hugging Face:小模型可用更長的運算時間,得到更好的準確率;OpenAI公布最新旗艦模型o3;Meta BLT語言模型架構突破分詞技術極限;DeepSeek V3模型釋出

2024-12-29

| Hugging Face | DVTS | Deepmind

小模型可用更長運算時間換取更高精準度,Hugging Face發表測試階段運算擴展的研究

Hugging Face研究顯示小型模型在測試階段運算擴展(Test-Time Compute Scaling)下,能在數學推理等特定任務中超越大型模型

2024-12-25

| Hugging Face | SmolVLM

Hugging Face公布可在裝置上執行的小型多模態模型SmolVLM

SmolVLM為參數量20億的小型多模態模型,可接受以任意圖片和文字的組合作為輸入,並生成文字輸出

2024-11-28

| SmolLM2 | Hugging Face

Hugging Face公布手機執行的小型語言模型SmolLM2

Hugging Face強調1.7B參數版本的SmolLM2在多項標竿測試上,優於Llama-1B及阿里巴巴的Qwen2.5-1.5B,但SmolLM2現階段只支援英文

2024-11-04

| Getty Images | Hugging Face

Getty Images釋出訓練AI模型的高畫質視覺資料集

Getty Images在Hugging Face平臺釋出高畫質照片樣本資料集,藉此吸引企業及開發商使用付費授權服務

2024-09-09

| LeRobot | Hugging Face | 機器人 | 開發套件

Hugging Face公布簡單開發AI機器人的套件LeRobot,150美元就完成

LeRobot套件提供包含模型、資料集與PyTorch開發工具在內的機器人開發資源

2024-08-21

| Stability AI | Stable Fast 3D | 3D模型 | Hugging Face

Stability AI發表Stable Fast 3D新模型,從單張圖生成3D模型只要0.5秒

Stability AI新模型Stable Fast 3D,能在0.5秒內生成高品質3D模型,提供精確UV網格展開和材質設定資訊,適用包括遊戲開發、VR與產品視覺化等多種場景

2024-08-02

| Hugging Face | Nvidia | Nim | Inference-as-a-Service | 生成式AI | 推論即服務

Hugging Face推出依用量計價的Nvidia NIM推論即服務

Hugging Face企業平臺推出雲端推論即服務(inference-as-a-service),以Nvidia DGX Cloud以及容器化推論微服務NIM為技術核心

2024-07-30

| SmolLM-Corpus | 資料集 | 小語言模型 | SmolLM | Hugging Face

Hugging Face公布可在手機上執行的語言模型SmolLM家族

Hugging Face研究人員公布小語言模型家族SmolLM,強調是以謹慎策畫的高品質資料集訓練而成,同時釋出該資料集並說明其內容及規畫方法

2024-07-18

| 開源大型語言模型 | Hugging Face | 阿里巴巴 | Qwen 2 | Gemma 2

Hugging Face第二屆LLM排行榜出爐,中國LLM表現出色

Hugging Face以MMLU-Pro等六大測試基準,評測市面上的開源LLM,結果顯示阿里雲的Qwen 2凌駕Meta Llama 3-70B拿下第一,另一方面Google Deepmind研究人員則強調新公布的Gemma 2是最好的開源模型

2024-07-01