當數據成為第一生產要素,端到端的數據戰略將成為現代化的企業騰飛利器!
納斯達克,不僅是金融市場的代名詞。更是數據作為第一生產要素的代表!
納斯達克海量的數據處理,直面三大挑戰:首先是規模,系統一天就要無縫處理上千億美元的交易;其次是彈性,平時系統每秒處理300萬條信息;但高峰期,12小時內有600億條信息進入交易系統,以及超過1200億條信息導出系統;第三是速度,每20微秒就需要進行一次訂單交易處理,比人類眨眼速度還要快1萬倍。
面對海量數據、海量交易,面對實時性要求極高的數據處理需求,納斯達克選擇了亞馬遜云科技作為云基礎設施,積極打造為資本市場提供技術和SaaS服務的供應商角色。在體會到了云技術以及降低成本等方面的優勢之后,納斯達克開始把包括數據分發、營收分析、監管報告和市場運營系統等更多系統遷到亞馬遜云科技上。
納斯達克跟亞馬遜云科技的合作,意義遠不止于此。如今,納斯達克不僅通過Outposts建立了一個混合架構,推出了金融行業的第一個專用亞馬遜云科技本地區域。而且通過標準化的上云路徑為全球的130多個企業客戶提供服務,將企業客戶的數據孤島打通,真正能夠更好的為數據服務,創造新的價值。
納斯達克與亞馬遜云科技的故事,發生在此次re:Invent全球大會上,納斯達克宣布將分階段把全部業務遷移到亞馬遜云科技。2022年,納斯達克將先把美國一個期權交易市場上云。這意味著納斯達克將把自己的核心業務,與云進行深度捆綁。亞馬遜機器學習副總裁 Swami Sivasubramanian指出,如果把數據從采集、存儲、分析到最終價值的挖掘比喻成一場數據的旅行,那么這段旅行中的每一個階段,都需要現代化的創新工具來輔助它。
數據價值之旅,需要端到端的現代化數據工具
最近研究報告顯示,從現在到2024年,全球三年產生的數據量將會超過過去30年產生的所有數據量。針對海量數據,以及數據的多樣化,從數據采集、存儲、分析到價值挖掘,每一個階段都面臨著不同的挑戰。無論是工業設備的數據、網站的日志數據、金融的風控數據,還是基因組研究分析的數據等都需要從底層架構、存儲系統、數據管理和業務創新角度進行多方位融合和創新。
為了實現數據價值之旅,亞馬遜云科技能夠為數據服務提供從數據存儲、到計算、分析、人工智能創新的完整的、端到端的工具。并從數據架構現代化、統一數據分析以及基于數據進行業務創新三個維度實施現代化端到端數據戰略。利用廣泛而深入的云服務,憑借在數據領域的產品創新與前瞻眼光,助力企業實施現代化的端到端數據戰略,實現數據驅動的創新。
現代化的應用催生現代化的數據架構
今天有太多的現代化應用,無論是像電商、購物還是視頻、社交、出行類等不同應用的App,其產生的數據級別都是PB甚至EB級,而且這些應用要應付的并發請求要服務于全世界幾億人,同時在高峰期還要保持超低的延遲,這些現代化應用需求呼喚新的數據庫技術。因此,數據架構的現代化首先從數據庫開始,針對不同的場景需要使用專門構建的工具,專門的工具需要專業的現代化托管平臺,亞馬遜云科技擁有無與倫比的成熟度和經驗。此次re:Invent,亞馬遜云科技在已經很豐富的數據服務組合之上,又發布多個數據工具。包括:
Amazon DevOps Guru for RDS是一個數據庫性能工具,它利用機器學習,可以在幾分鐘內自動檢測、診斷和解決難以發現的數據庫性能問題。
Amazon RDS Custom 提供了 SQL Server支持,它通過托管式服務節省時間,幫助實現自動化版本維護與補丁升級,將寶貴的資源專注于更重要的業務。
本次re:Invent,另外一個重要的發布是Amazon Dynamodb 的新功能Standard-Infrequent Access表類,它可以將不頻繁訪問的表數據進行分類,DynamoDB 的存儲成本降低可達60%。
Amazon Database Migration Service Fleet Advisor 是一個數據庫遷移工具,它允許您通過自動發現和分析遷移隊列來快速構建數據庫和數據分析服務遷移計劃。Amazon DMS Fleet Advisor 面向希望將大量數據庫和分析服務器遷移到亞馬遜云科技的用戶。
打破數據孤島,實現數據統一分析
今天,包括制造、金融、互聯網等行業不僅有來自數據庫的結構化數據、視頻圖片等非結構化數據,同時也產生了大量的來自于工業設備和網站日志的半結構化數據,如何將來自于數據庫、數據倉庫等結構化數據,以及來自多種數據源的半結構化、非結構化的數據全部整合在一起,并利用這些數據進行分析和機器學習成為業內企業面臨的挑戰。
亞馬遜云科技通過云上專門工具實現數據有機整合與統一,助力企業打破數據孤島。通過在亞馬遜云科技上運行的數據湖,能夠收集、存儲和分析來自一系列分散系統的數據,助力業務發展。亞馬遜云科技為在 Amazon S3 上構建數據湖提供了無與倫比的耐用性、可用性和可擴展性,以及強大的安全性和分析工具,使用亞馬遜云科技最新發布的數據湖構建工具,可以快速構建適合的數據湖,如今全球客戶在亞馬遜云科技上擁有數十萬個數據湖,比如Amazon Lake Formation,目的就是幫助企業快速的去構建數據湖,同時可以構建統一的數據湖的管理;而Amazon Athena 能夠提供了一種有用的方法來分析所有數據,獲得見解;利用 Amazon QuickSight Q,客戶可以快速、輕松地獲得答案,所有用戶無需培訓即可訪問 BI。
通過賦能業務創新體現數據價值
“以客戶為中心”相信是根植于每個企業的業務發展過程中,因此,通過數據進行創新的內核是“從客戶角度出發”,通過企業基于自身業務的創新訴求這個原動力來實施數據創新。人工智能等技術為創新提供了新的手段和方法,來讓公司或者組織中的每個人都可以更容易、更加自助地做數據分析和洞察,讓不懂SQL、數據分析技術的業務人員也可以更自助、更主動利用數據分析和機器分析的能力做他的業務決策和進行數據分析。
本次re:Invent,亞馬遜云科技業界聞名的機器學習平臺Amazon SageMaker又添六項新功能來助力企業進行業務決策和數據分析。
亞馬遜云科技新推出的Amazon SageMaker Ground Truth Plus,讓用戶無需編寫任何代碼即可快速交付高質量的訓練數據集。數據是機器學習的燃料。不過,準備數據的過程令人痛苦沮喪甚至令人憤怒。這項新功能,極大地解決了數據科學家準備數據的痛點問題。
在模型構建與算法編寫環節,新推出的Amazon SageMaker Studio Notebook 允許用戶訪問廣泛的數據源,在一個記事本中執行數據工程、分析和機器學習工作流。
新推出的Training Compiler 模型訓練編譯器,讓機器學習模型培訓速度提高50%。Inference Recommender 模型推理推薦程序,可將部署時間從數周減少到數小時。Serverless Inference 無服務器推理(預覽版),通過按使用付費的定價降低擁有成本。
寫在最后,可以看到如果想釋放數據的更大價值,一方面要看到數據的流動屬性,通過亞馬遜云科技的創新工具可以在數據庫、數據湖、分析引擎和機器學習工具之間讓數據更好地自由流動,另一方面要實現數據和業務的融合創新,這樣就能助力企業利用數據得到更好的洞察,更快速的采取行動,最終實現企業的核心競爭力。
本文章選自《AI啟示錄》雜志,閱讀更多雜志內容,請掃描下方二維碼