| Dataset Search | schema.org | 資料集 | 搜尋引擎 | google | 資料使用 | 開放資料

Google資料集搜尋引擎Dataset Search正式版出爐了,已索引2,500萬個資料集

Dataset Search提供經組織且結構化的各類資料集以及政府開放資料,格式包括照片、表格或文字,目前以地球科學、生物學及農業類別資料為大宗

2020-01-24

| 臉書 | 紐約大學 | FastMRI | 資料集 | AI

研究計畫FastMRI釋出腦部MRI資料集

由FastMRI釋出的這個神經成像資料集,包含龐大k-space格式腦部MRI的公開數據集,可用來訓練機器學習模型並驗證結果

2019-12-14

| google | 資料集 | 氣候

Google公開資料集釋出最新CMIP6氣候資料

模擬各種極端氣候的模型資料CMIP6檔案大小高達20PB,目前先在Google雲端公開了100TB

2019-12-11

| AWS | 資料集 | 機器學習

AWS推出第三方資料訂閱服務Data Exchange

用戶可簡單地在AWS Data Exchange上搜尋並訂閱資料,並在資料集有更新時自動取得新資料。

2019-11-15

| google | 智慧助理 | 資料集 | 機器學習

Google釋出用於訓練通用智慧助理的架構引導對話資料集

智慧助理擁有的服務越來越多樣,Google發表了架構引導對話資料集,幫助研究人員訓練出可處理多領域任務的單一模型

2019-10-30

| google | 數位助理 | 自然語言 | 資料集 | AI

Google釋出兩神經語言對話資料集

Google強調自家資料集中的對話,保留了人類口語的特徵,可用於提升使用者與數位助理的對話品質

2019-09-10

| Lyft | 自駕車 | 資料集

Lyft釋出Level 5自駕車研究資料集

這個資料集由Lyft自駕車隊上的先進感測器收集而來,內含經人類標記的影格,以及車道與人行道等語意地圖

2019-07-25

| google | Youtube | 資料集

Google推出YouTube-8M Segments時間定位資料集

Google在原本的影像分類資料集YouTube-8M,隨選出影片並增加實體對時間定位資訊,並經過人工驗證釋出YouTube-8M Segments資料集

2019-07-02

| google | 地標 | 物體辨識 | 資料集

Google釋出超過500萬張圖片的地標辨識新資料集

Google發布用於訓練地標辨識模型的新版資料集Landmarks-v2,資料量是第一版的2倍

2019-05-06

| Mozilla | Common Voice | 資料集 | 語音辨識

Mozilla公開全球最大公共領域轉錄語音資料集

Mozilla共享了語音群眾外包計畫Common Voice最新的結果,一個包含42,000人共18種語言的1,400小時語音片段資料集。

2019-03-01

| google | BigQuery | 資料集

BigQuery新增協作功能方便團隊共享查詢結果

現在使用者只要在儲存的查詢,點擊鏈結共享按鈕,就能將查詢結果分享給團隊其他成員,成員也能看到使用者對查詢做出的更新。

2019-01-15

| UC Berkeley | 自駕車 | 資料集

UC Berkeley開源全球最大的自駕車資料集,資料量是百度ApolloScape的800倍

加州柏克萊大學DeepDrive實驗室釋出了自駕車影片資料集BDD100K,涵蓋10萬個自駕車影片,每個影片長度約40秒、720p畫質,且涵蓋許多城市、不同路況,以多樣性著稱。

2018-06-06