2016 年 1 月

第 31 卷,第 1 期

本文章是由機器翻譯。

編輯的話- 闖出名堂,否則打道回府

Michael Desmond |2016 年 1 月

Michael Desmond巨量資料是快速成為大型企業,並因此產生大量的開發活動。市場預測研究搭配 Wikibon 專案從該消費巨量資料技術和服務會到達 49.28 億美元於 2018,總從 27.36 億美元 2014年中。

可想而知,Microsoft 致力於讓開發人員在巨量資料案例。在 San Francisco 最後一個月的 Build 研討會,在該公司會介紹 Azure SQL Database 服務,例如 Azure 資料倉儲、 Azure 資料湖和彈性資料庫。當我們移轉到 2016年,努力開始謹記水果。其中說明為什麼本月的 MSDN 雜誌著重於巨量資料技術和開發。

Michael Rys,在功能中,「進行大型資料批次分析更容易使用 U-SQL,,「 探索新的 U SQL 語言結合了 SQL 和 C# 的語意,以支援巨量資料案例。接下來,Omid Afnan 示範如何收集、 分析和連續資料流的即時在他的文章,「針對.NET 開發人員的即時資料分析使用 HDInsight。 」 集合中,Gaurav Malhotra 的最後一篇文章 「建立大型資料的管線使用 Azure 資料湖和 Azure Data Factory,,「 逐步建置巨量資料管線將 Web 記錄資料移動到 Azure 資料湖存放區,使用 Azure Data Factory 和處理使用 U SQL 指令碼在 Azure 資料湖分析服務該資料。

為什麼巨量資料及為什麼要儘快升級? 為 Afnan 備忘稿 2015年是一大年在 Microsoft 的巨量資料。

「 雖然我們已經成為內部多 exabyte 延展我們巨量資料案例中,我們所提供許多新功能在 Azure 中,「 Afnan 說。「 HDInsight 和 Azure 資料湖的發行版本中的進階功能讓巨量資料大幅提升了開發人員。ADL 分析和儲存體抽離分散式運算叢集的複雜性可讓開發人員專注於查詢和商務層級的彙總並對應減少下方架構 >。

他也 cites Visual Studio 工具,可簡化程式碼撰寫和偵錯 ADL 和 HDInsight 最新的投資。Afnan 儘管如此,說開發工作室面對的挑戰是,當遇到 「 三個 V 的 「 巨量資料的周圍陡峭的學習曲線,速度、 各種和磁碟區 — 和分散式的多階段處理使用的空間中的模型。

「 理想的起點是找出要開始收集感興趣的未經處理資料到巨量資料存放區,然後啟動 [瀏覽資料集、 尋找 insights 以及最終操作程序的方式,」 他說。「 減少熱身時間可透過減少需要管理的項目數目。運用巨量資料平台具有工作抽象概念是肯定的好方法,以避免 floundering 和放棄。 」

Microsoft 的目標是協助開發人員參與的挑戰,提供工具和公開和簡化的新功能的平台的商店。其中包括說 Afnan,新的開發人員工具,如 」 更複雜的偵錯情節個別的節點頂點失敗、 瀏覽資料誤差的問題,以及相同的指令碼的多個回合的分析。 」

有很興奮處於巨量資料空間。我期待我們會看到許多有關巨量資料我們頁面中的幾個月和年。


Michael Desmond是 MSDN Magazine 的總編輯。