| Databricks | SQL | 無伺服器

Databricks發布Serverless SQL,用戶不須管理伺服器即時獲得SQL運算能力

Databricks Serverless SQL讓用戶不須要管理伺服器,可以從Databricks管理的伺服器池中,按需取用商業智慧和SQL運算能力

2021-09-06

| Databricks | AutoML | 機器學習ML | AI

Databricks推AutoML簡化機器學習模型建置

AutoML提供建置模型的完整程式碼,包括訓練、測試還有超參數調校等,讓用戶可以輕易地進行額外自定義

2021-05-31

| Databricks | Parquet | 資料共享

DataBricks發表安全資料共享開源協定Delta Sharing

透過資料交換協定Delta Sharing,使用者能夠跨組織跨系統安全地交換資料集,消除大量過去交換資料所要付出的工作和時間

2021-05-27

| google | Databricks | 資料科學

Google雲端整合資料科學平臺Databricks

與Google雲端整合,是Databricks首次在雲端上提供容器化部署,讓用戶可以快速在全球創建Databricks資料小屋

2021-02-19

| Databricks | MLflow | PyTorch

機器學習平臺MLflow 1.12開始整合PyTorch

MLflow現在可將PyTorch模型,轉換成為更通用的TorchScript表示方式,或直接將模型部署到模型伺服器TorchServe

2020-11-18

| Databricks | 資料湖 | 資料倉儲

Databricks推出SQL Analytics解決方案,要讓用戶把資料湖用作資料倉儲

SQL Analytics可以讓用戶利用SQL對資料湖進行查詢,並且提供連接器,連接既有的商業智慧工具,使資料湖泊能夠取代資料倉儲

2020-11-16

| Nvidia | Databricks | Spark | GPU

Nvidia與Databricks合作,讓Spark可用GPU加速模型訓練

在即將釋出的Spark 3.0將原生支援Nvidia GPU,可大幅提升ETL和模型訓練的執行效能

2020-05-17

| Databricks | AutoML | 機器學習

Databricks釋出AutoML工具,自動化機器學習工作管線

整合分析平臺加入了自動化機器學習功能,讓使用者不用撰寫程式碼,就能完成整個工作管線

2019-08-21

| Databricks | MLflow | 機器學習

Databricks釋出MLflow 0.8.0,改善實驗用UI、可以Docker容器部署模型到Azure上

MLflow 0.8.0改善四個使用者介面功能,分別是緊湊的指標和參數顯示、巢狀執行(Nesting Runs)、標記執行(Labeling Runs)、以及記憶使用者介面設定。

2018-11-23

| Databricks | MLflow | R

Databricks釋出機器學習平臺MLflow 0.7.0,整合R釋出追蹤API

RStudio對MLflow貢獻了R客戶端追蹤API,允許開發者在程式執行階段,紀錄參數、程式碼版本、指標和輸出檔案,病以MLflow UI視覺化實驗結果。

2018-10-04

| 大資料 | Databricks | RStudio

Databricks整合RStudio,讓R語言搭上Spark大資料運算平臺

RStudio整合到Databricks的統一分析平臺,除了提供資料科學家大規模分散式R運算外,還能使用原本Databricks平臺上梳理資料的ETL功能。

2018-06-28

| Databricks | 機器學習 | MLflow

Databricks開源機器學習平臺MLflow,以標準格式打破工具平臺的界線

Apache Spark技術團隊所創立的企業Databricks認為,市面上的機器學習通常不容易追蹤機器學習的實驗外,也很難重現相同的結果,機器學習模型移植不易,因此動手開發了開源機器學習平臺MLflow,來試圖解決這些問題。

2018-06-07