微軟 Build 2021:展示Power BI與Cosmos DB最新功能
微軟Build開發(fā)者大會(huì)——Build 2021,又回來了!現(xiàn)在,即使是線上的活動(dòng)也形成了一年一度的新傳統(tǒng)不過,微軟還保持了另一項(xiàng)由來已久的傳統(tǒng),就是利用Build開發(fā)人員大會(huì)來宣布公司在數(shù)據(jù)和分析方面的新進(jìn)展。
今年,盡管微軟本身并沒有帶來突破性的新聞,但是在云端的BI和數(shù)據(jù)庫產(chǎn)品方面,微軟交出了長長的清單,里面列舉了很多新功能和新服務(wù),這些內(nèi)容也非常令人印象深刻。
全程強(qiáng)大的數(shù)據(jù)流和聚合
讓我們從微軟的Power BI公告開始。公告包含了處理從數(shù)據(jù)來源(Azure IoT Hub和Azure Event Hubs)獲得數(shù)據(jù)流的Power BI數(shù)據(jù)流功能(云端的功能就是Power Query)。微軟的團(tuán)隊(duì)承諾稱,它將讓流數(shù)據(jù)和實(shí)時(shí)分析像批處理數(shù)據(jù)和常規(guī)分析一樣易于使用——不僅僅是針對BI專家和數(shù)據(jù)工程師,還可以適用于商業(yè)用戶。而且由于事件中心(Event Hubs)可以在Apache Kafka兼容模式下工作,因此引發(fā)了一個(gè)問題,即該功能是否有一天可以與該開源流事件平臺(tái)一起工作。
另一個(gè)有趣的功能被稱為自動(dòng)聚合。要了解此功能,你必須了解作為其基礎(chǔ)的基本聚合功能。基本聚合功能使你可以在度量的基礎(chǔ)上預(yù)先計(jì)算聚合,從而獲得出色的性能,特別是針對那些Power BI已經(jīng)通過DirectQuery連接了的數(shù)據(jù)源時(shí),更是如此。DirectQuery可以從后端數(shù)據(jù)源獲取數(shù)據(jù)。
通過聚合,Power BI可以避免一直到后端獲取通用匯總數(shù)據(jù),而將這種方式保留給相對較少的詳細(xì)數(shù)據(jù)集。聚合的問題在于,用戶必須在建模Power BI要查詢數(shù)據(jù)的時(shí)候設(shè)計(jì)聚合。這里有一個(gè)好消息,自動(dòng)聚合功能將根據(jù)實(shí)際觀察到的查詢模式自動(dòng)構(gòu)建這些算法,隨著收集到的此類觀察結(jié)果數(shù)量的增加,它的表現(xiàn)還會(huì)變得越來越好。
數(shù)據(jù)流和自動(dòng)聚合的預(yù)覽版本都將在7月發(fā)布,這兩個(gè)功能都是Power BI Premium專有的。由于Premium現(xiàn)在是按用戶提供服務(wù),用戶需要在Power BI Pro的基礎(chǔ)上每個(gè)月多支付10美元以使用Premium功能。因此這些功能和更多的用戶都相關(guān)。同時(shí),另一項(xiàng)Premium功能——Power BI部署管道(Power BI deployment pipelines)——可以獲取面向開發(fā)人員的自動(dòng)化API(Automation APIs)以支持Azure DevOps、GitHub和Azure Pipelines等工具,讓它們可以自動(dòng)化地部署Power BI資產(chǎn)。自動(dòng)化API(Automation APIs)現(xiàn)在已經(jīng)可以使用了。
這里有很多只針對Premium用戶的功能,而“高級(jí)用戶”的定價(jià)意味著我們將會(huì)看到更多這樣的功能。同時(shí),微軟還發(fā)布了一個(gè)很酷的新功能,該功能允許將Power BI報(bào)告被內(nèi)嵌到Jupyter筆記本中——作為開源Python包。而且它與Power BI Pro兼容,包括可免費(fèi)試用的版本。下圖是一個(gè)裝有Power BI的Jupyter筆記本的圖片。
COSMOS DB:無服務(wù)器、緩存、加密和免費(fèi)
在數(shù)據(jù)庫方面,微軟發(fā)布了很多關(guān)于Cosmos DB的消息,還有一些是關(guān)于MySQL和Postgres的零散消息。
首先,是Cosmos DB——微軟的大規(guī)模多模型托管NoSQL數(shù)據(jù)庫。微軟將無服務(wù)器選項(xiàng)納入了Cosmos DB的通用可選范圍之內(nèi),并包含Cosmos的很多API,將它的云原生譜系拓展了一步。無服務(wù)器版本的Cosmos DB讓用戶可以在無需提供顯式規(guī)模集群的情況下使用它,因此能夠更好地應(yīng)對微軟所謂的“尖峰流量模式”。即使對于習(xí)慣了集群規(guī)模調(diào)整的客戶來說,這種無服務(wù)器的選項(xiàng)也將在實(shí)質(zhì)上提供零維護(hù)的自動(dòng)規(guī)模調(diào)整。畢竟,無服務(wù)器的信條是讓服務(wù)承擔(dān)在你需要的時(shí)候?yàn)槟惴峙滟Y源的責(zé)任。
Cosmos也獲得了很多新功能,那些熟悉舊式關(guān)系型數(shù)據(jù)庫的專業(yè)人員們可能會(huì)喜歡這些功能。其中包括集成的緩存,基于角色的訪問控制(RBAC)和始終加密(Always Encrypted)——這是一個(gè)源自SQL Server和Azure SQL數(shù)據(jù)庫的功能,在數(shù)據(jù)被存入數(shù)據(jù)庫之前,就在應(yīng)用程序內(nèi)進(jìn)行完全加密。集成的緩存服務(wù)特別有趣,因?yàn)樗粌H可以提高性能,而且可以通過減少對數(shù)據(jù)庫的完整讀取來節(jié)省資金。微軟表示,緩存可以降低成本,并將大量讀取工作負(fù)載的性能分別提高多達(dá)96%和300%。
Cosmos DB還擴(kuò)展了它的免費(fèi)功能。新產(chǎn)品為開發(fā)人員提供每個(gè)月1,000 RU/s(每秒請求單位)的預(yù)配置吞吐量和25GB的免費(fèi)存儲(chǔ)空間。談到免費(fèi)——微軟已經(jīng)在這個(gè)方向努力了一段時(shí)間了,該公司提供了Cosmos DB仿真器,它讓開發(fā)人員能夠在正常工作的Cosmos DB實(shí)例上運(yùn)行其代碼,而且無需支付任何云費(fèi)用。以前,該仿真器只能在Windows計(jì)算機(jī)上運(yùn)行,但是微軟今天發(fā)布了該仿真器的Linux版本,它也可以運(yùn)行在Mac機(jī)器上。像Cosmos DB Serverless一樣,新發(fā)布的免費(fèi)功能都已經(jīng)全面上市。同時(shí),集成緩存、始終加密(Always Encrypted)和Linux仿真器推出了預(yù)覽版。
回到關(guān)系數(shù)據(jù)庫的世界,微軟宣布將從六月開始提供12個(gè)月免費(fèi)的Azure Database for PostgreSQL和Azure Database for MySQL Flexible Server,微軟將為使用Azure免費(fèi)帳戶的用戶每個(gè)月提供最多750個(gè)小時(shí)的免費(fèi)服務(wù)。此外,對于Azure Database for PostgreSQL——Hyperscale (Citus)這個(gè)新推出的免費(fèi)功能預(yù)覽版,微軟將提供基于單節(jié)點(diǎn)部署的入門級(jí)功能。至少可以說,對于單節(jié)點(diǎn)部署來說,無論如何都很難說得上有“超大規(guī)模”,所以最好用和Cosmos DB仿真器相同的方式來對待它——作為開發(fā)和測試代碼的一個(gè)工作端點(diǎn)。區(qū)別在于它可以就地生產(chǎn),因?yàn)槲④浱峁┝撕罄m(xù)增加工作節(jié)點(diǎn)并進(jìn)行擴(kuò)展的選項(xiàng)。
本文章選自《AI啟示錄》雜志,閱讀更多雜志內(nèi)容,請掃描下方二維碼