微軟開源自家Spark資料串流工作管線建置工具Data Accelerator
Data Accelerator能推斷輸入事件的結構,並以使用者設定的規則修改事件後,將資料寫出到輸出資料池
2019-04-22
| 大資料 | Databricks | RStudio
Databricks整合RStudio,讓R語言搭上Spark大資料運算平臺
RStudio整合到Databricks的統一分析平臺,除了提供資料科學家大規模分散式R運算外,還能使用原本Databricks平臺上梳理資料的ETL功能。
2018-06-28
Hadoop 3.0正式登場,擴充力增加十倍,單一叢集能管10萬臺
微軟貢獻了稱為YARN Federation的功能後,讓Hadoop的叢集節點數量,從原本約一萬臺,增加了十倍,單一叢集可以容納10萬個節點。
2017-12-15
【2016 Teradata大數據峰會直擊】Teradata朝開源再邁進一步,要幫企業打造資料分析的生態系統
Teradata宣布進一步擁抱開源,目前旗下的開源服務已經拓展至美洲、歐洲及亞洲,現在也要進軍中國市場,將由2年前收購大資料技術整合與諮詢公司Think Big,來協助企業有效部署自己的資料湖、打造如Hadoop、Spark、Kafka、HBase等大資料平臺及採用各項開源套件應用,並建立一個資料分析的生態系統,也就是先前推出的統一資料架構平臺UDA
2016-05-06
| google | Spotify | Cloud Platform | 大資料 | 音樂串流
Spotify採用Google雲端平臺服務,每秒可處理上萬筆訊息
Spoify決定採用Google雲端平臺來提供音樂串流服務,而遷移後端資料和技術服務的大工程將分為服務和資料2大部分,Google宣稱,Spotify資料查詢工作將可在1至2分鐘內完成,且可在每秒處理成千上萬筆訊息。
2016-02-25
中正大學犯罪防治中心利用新北市警察局刑案資料繪製報案斑點圖,再經由大資料技術分析犯罪成長曲線,下一階段將透過資料探勘和分析技術找出預測模型,協助警方更有效預防犯罪
2016-02-14
Cloudera推出新版大資料管理工具,簡化企業級Hadoop雲端部署工作
Hadoop企業版發行商Cloudera釋出大資料部署和管理工具Cloudera Director 2.0,簡化了在雲端執行Hadoop的工作,如ETL、Modeling、BI分析等,也與Aamzon AWS、Google雲端平臺、微軟Azure合作,提供混合的作業環境。目前已開放免費下載新版Cloudera Director。
2016-01-27