AWS 推出 Amazon Athena
西雅圖-- Amazon.com 旗下公司(納斯達克股票代碼:AMZN)今天宣布推出 Amazon Athena,這是一種無服務(wù)器查詢服務(wù),可以輕松地直接在 Amazon Simple Storage Service 中分析數(shù)據(jù)(Amazon S3) 使用標(biāo)準(zhǔn) SQL。只需在 AWS 管理控制臺中單擊幾下,客戶就可以將 Amazon Athena 指向他們存儲在 Amazon S3 中的數(shù)據(jù),并開始使用標(biāo)準(zhǔn) SQL 運行查詢并在幾秒鐘內(nèi)獲得結(jié)果。使用 Amazon Athena,無需管理和調(diào)整集群,無需設(shè)置或管理基礎(chǔ)設(shè)施,客戶只需為他們運行的查詢付費。 Amazon Athena 可自動擴展(并行執(zhí)行查詢),因此即使處理大型數(shù)據(jù)集和復(fù)雜查詢,結(jié)果也很快。要開始使用 Amazon Athena,請訪問 。
“在 mParticle,我們收集和處理大量數(shù)據(jù)。我們希望我們所有的客戶都能夠使用 SQL 等簡單語言處理原始數(shù)據(jù)”
Amazon Redshift 和 Amazon EMR 等 AWS 分析服務(wù)使各種規(guī)模的公司都可以訪問 PB 級分析。使用 Amazon Redshift,客戶可以對大量結(jié)構(gòu)化數(shù)據(jù)執(zhí)行復(fù)雜的查詢并獲得超快的性能。對于非結(jié)構(gòu)化數(shù)據(jù),Amazon EMR 可以使用流行的分布式框架(如 Apache Spark、Presto、Hive 和 Pig)快速且經(jīng)濟高效地處理和分析動態(tài)可擴展集群中的大量數(shù)據(jù)。雖然這些服務(wù)可擴展且功能強大,足以處理最大和最復(fù)雜的大數(shù)據(jù)應(yīng)用程序,但許多客戶還希望能夠非??焖俚貙Υ鎯υ?Amazon S3 中的數(shù)據(jù)(例如 Web 日志、點擊流和原始事件文件)運行查詢,而無需必須啟動、配置和管理 Hadoop 集群或數(shù)據(jù)倉庫?,F(xiàn)在,借助 Amazon Athena,分析存儲在 Amazon S3 中的數(shù)據(jù)就像編寫 SQL 查詢一樣簡單。 Amazon Athena 使用具有完整標(biāo)準(zhǔn) SQL 支持的 Presto,并使用各種標(biāo)準(zhǔn)數(shù)據(jù)格式,包括 CSV、JSON、ORC 和 Parquet。而且,雖然 Amazon Athena 非常適合快速、即席查詢并與 Amazon QuickSight 集成以實現(xiàn)輕松可視化,但它還可以處理復(fù)雜的分析,包括大型聯(lián)接、窗口函數(shù)和數(shù)組。由于 Amazon Athena 使用多個可用區(qū)中的計算資源執(zhí)行查詢并使用 Amazon S3 作為底層數(shù)據(jù)存儲,因此它具有高度可用和持久性,數(shù)據(jù)在每個設(shè)施中的多個設(shè)施和多個設(shè)備中冗余存儲。
“在過去幾年中,AWS 構(gòu)建了一套全面的大數(shù)據(jù)服務(wù),客戶可以使用這些服務(wù)來完成從流數(shù)據(jù)實時分析到 PB 級數(shù)據(jù)倉庫或 Spark 和 Hadoop 作業(yè)的所有工作——而且速度很快,可擴展且具有成本效益,”AWS 數(shù)據(jù)庫、分析和人工智能副總裁 Raju Gulabani 說。 “對于數(shù)十萬客戶而言,Amazon S3 是他們的主要數(shù)據(jù)存儲——擁有數(shù)十億到數(shù)萬億個對象??蛻艚?jīng)常問我們是否可以讓任何人輕松地在 Amazon S3 中對他們的數(shù)據(jù)運行查詢,而不必?fù)?dān)心預(yù)置或管理服務(wù)器和集群?,F(xiàn)在他們可以了。 Amazon Athena 的管理員絕對為零——任何可以編寫 SQL 查詢的人都可以在 Amazon S3 中分析他們的數(shù)據(jù)。 Amazon QuickSight 和 Amazon Athena 緊密集成,使客戶無需編寫 SQL 查詢即可可視化他們的 Amazon Athena 查詢結(jié)果?!?/p>
新聞集團首席技術(shù)官 Paul Cheesbrough 說:“我們是 AWS 的長期客戶,并使用 Amazon Redshift 和 Amazon EMR 等服務(wù)來支持和推動整個公司的分析。我們獲得了對 Amazon Athena 的早期訪問權(quán)限,并且它已被證明是快速、易于使用且具有成本效益的。我們的工程師和分析師團隊給予了我們很好的反饋,特別是關(guān)于 Amazon Athena 直接從 Amazon S3 查詢的能力,我們對該服務(wù)的下一步發(fā)展感到興奮。”
LiveIntent 是一個專注于電子郵件渠道的基于人的營銷和廣告平臺,每月通過 1,300 家頂級出版商發(fā)送的電子郵件,幫助 1,100 多個品牌向 1.45 億人提供營銷和廣告。 “LiveIntent 平臺每天收集和處理數(shù)億個事件。我們不斷挑戰(zhàn)自己,以構(gòu)建和擴展平臺,以提供更快、更便宜的數(shù)據(jù)訪問,從而為我們的客戶提供更好、更快的洞察力,”LiveIntent 工程執(zhí)行副總裁 Eric Raab 說。 “我們發(fā)現(xiàn) Amazon Athena 比我們評估并決定立即利用其功能的任何其他解決方案都更快、更便宜。我們非常喜歡 Amazon Athena 的零管理,而且我們可以直接從 Amazon S3 查詢多種格式,而無需加載?!?/p>
DataXu 幫助營銷人員了解營銷投資如何利用數(shù)據(jù)帶來可盈利的客戶關(guān)系。 “我們每秒處理超過 300 萬個投標(biāo)請求,這導(dǎo)致每天總共有 3PB 的傳入數(shù)據(jù)。即使進行了壓縮和縮減,這也會導(dǎo)致每天產(chǎn)生超過 180 TB 的日志,”DataXu 工程副總裁 Yekesa Kosuru 說。 “我們一聽說 Amazon Athena 就開始使用它,并且喜歡它的簡單性、速度和按查詢付費的定價模式。 Amazon Athena 使我們能夠查詢存儲在 Amazon S3 上的整個數(shù)據(jù)集,而無需管理基礎(chǔ)設(shè)施。因為沒有什么需要管理的,而且我們只為每次查詢付費,所以我們正在整個公司積極部署 Amazon Athena。”
Gunosy 是日本領(lǐng)先的新聞管理應(yīng)用程序提供商。 “我們盡快開始使用 Amazon Athena,并且印象深刻的是,即使在預(yù)覽版中,Amazon Athena 的速度也比我們一直使用的系統(tǒng)要快——即使它直接從 Amazon S3 查詢數(shù)據(jù),”Gunosy 數(shù)據(jù)科學(xué)家 Yosuke Abe 說。 “我們正在積極地將工作負(fù)載遷移到 AWS,因此我們可以將 Amazon Athena 置于我們分析平臺的核心?!?/p>
Inrix 是為企業(yè)、公共部門和媒體提供實時交通情報的領(lǐng)先提供商。 “在 INRIX,我們每天攝取數(shù) TB 的道路網(wǎng)絡(luò)和移動數(shù)據(jù),并運行數(shù)百個 Amazon EMR 數(shù)據(jù)管道來處理這些數(shù)據(jù)。我們使用 Amazon S3 作為我們未處理、正在處理和已處理數(shù)據(jù)集的存儲庫。我們的數(shù)據(jù)科學(xué)家需要對這些數(shù)據(jù)進行切片、切塊和分析,以構(gòu)建道路網(wǎng)絡(luò)預(yù)測分析的數(shù)學(xué)模型。 Inrix 集團工程經(jīng)理 Harsh Shah 說:“我們的數(shù)據(jù)工程師需要能夠從處理過的數(shù)據(jù)深入到過程中的數(shù)據(jù),以監(jiān)控和調(diào)試數(shù)據(jù)質(zhì)量問題?!?“我們抓住了試用 Amazon Athena 的機會,并且喜歡 Amazon Athena 提供的速度、易用性和靈活性。借助 Amazon Athena,我們的任何開發(fā)人員都可以使用 SQL 查詢我們存儲在 Amazon S3 上的所有數(shù)據(jù),而無需擔(dān)心基礎(chǔ)設(shè)施或大數(shù)據(jù)處理系統(tǒng)的知識。 Amazon Athena 使我們能夠快速將 Amazon S3 轉(zhuǎn)變?yōu)槲覀兊臄?shù)據(jù)湖。”Japan Taxi 是一款交通應(yīng)用程序,每月有 200 萬活躍用戶。 “將數(shù)據(jù)放入 Amazon S3 并在 Amazon Athena 中使用標(biāo)準(zhǔn) SQL 進行查詢的能力令人難以置信,”Japan Taxi 首席技術(shù)官 Kazuhiri Iwata 說。 “使用 Amazon Athena,我們不必加載數(shù)據(jù),因為該服務(wù)可以就地查詢數(shù)據(jù)。現(xiàn)在,我們的任何開發(fā)人員都可以以最低的成本以最精細(xì)的分辨率查詢數(shù)據(jù)——使我們能夠讓每個需要它的人輕松訪問我們的數(shù)據(jù)。由于 Amazon Athena 使用開源格式,我們還可以在相同數(shù)據(jù)上使用其他解決方案,例如 Amazon EMR,從而輕松實現(xiàn)互操作性。而且,由于 Amazon Athena 不需要管理,我們能夠立即開始?!?/p>
mParticle 允許移動應(yīng)用程序開發(fā)人員收集并理解他們的數(shù)據(jù)。 “在 mParticle,我們收集和處理大量數(shù)據(jù)。我們希望我們的所有客戶都能夠使用 SQL 等簡單語言處理原始數(shù)據(jù),”mParticle 首席技術(shù)官 Michael Katz 說。 “我們一聽說 Amazon Athena,就立即選擇了它,因為使用標(biāo)準(zhǔn) SQL 快速分析大量數(shù)據(jù)的能力對我們很有吸引力。使用 Amazon Athena,我們立即開始,按查詢付費,查詢運行迅速。我們喜歡 ANSI-SQL 兼容性,并且它可以查詢文本和列格式?!?/p>
納斯達克的技術(shù)為 50 個國家的 70 多個市場和全球十分之一的證券交易提供支持。 “基于創(chuàng)新愿景和顛覆傳統(tǒng),我們一直在尋找新的方法來提高效率,并在我們所有市場的業(yè)務(wù)領(lǐng)域獲得新的洞察力。鑒于數(shù)據(jù)對我們業(yè)務(wù)的成功至關(guān)重要,我們總是對新工具感興趣,以分析我們存儲在 Amazon Redshift、Amazon S3 和其他來源中的數(shù)據(jù),”納斯達克公司首席架構(gòu)師 Nate Sammons 說。我們希望擴展我們的 Amazon Redshift 數(shù)據(jù)倉庫并構(gòu)建安全、經(jīng)濟高效的長期數(shù)據(jù)存儲。我們選擇 Amazon S3 進行存儲并選擇 Presto 作為查詢和分析系統(tǒng)的一部分,因為它具有 ANSI-SQL 兼容性和快速的性能。我們預(yù)計 Amazon Athena 將通過消除對集群的需求并允許我們所有的分析師快速查詢 Amazon S3 中的數(shù)據(jù)來幫助我們進一步推進這一想法。”
JW Player 是世界上最受歡迎的視頻播放器之一,也是領(lǐng)先的數(shù)字和移動視頻解決方案公司,在所有設(shè)備(OTT、手機、平板電腦和臺式機)的超過 200 萬個網(wǎng)站上直播,每月獨立觀看次數(shù)超過 13 億次. “我們使用多種平臺來支持 JW Analytics Dashboard,它提供分析來衡量大型數(shù)據(jù)集的內(nèi)容性能。我們每天定期接收超過 4 億個事件,并且一直在尋找能夠簡化處理大型數(shù)據(jù)集,同時降低成本和復(fù)雜性的解決方案,”JW Player 工程副總裁 Rick Okin 說。 “Amazon Athena 為我們提供了一個易于使用、快速且具有成本效益的零管理解決方案。我們喜歡這樣一個事實,即我們可以將數(shù)據(jù)放在 S3 中,使用 Apache Parquet 等開放格式來實現(xiàn)與堆棧的其余部分的互操作性,并運行 SQL 查詢,而無需擔(dān)心集群或數(shù)據(jù)倉庫。”
Tableau 幫助人們查看和理解數(shù)據(jù)。 Tableau 首席開發(fā)官 Andrew Beers 表示:“我們的使命是讓盡可能多的人掌握數(shù)據(jù),以便他們能夠據(jù)此采取行動并對周圍的世界產(chǎn)生影響?!?“我們與 AWS 合作了很長時間,并與 Amazon Redshift、Amazon EMR 和 Amazon RDS 進行了原生集成。我們也很高興地宣布支持 Amazon Athena。結(jié)合使用 Tableau 和 Amazon Athena,客戶可以交互式、經(jīng)濟高效地可視化 Amazon S3 中的所有數(shù)據(jù),并且無需管理基礎(chǔ)設(shè)施?!?/p>
客戶可以通過 AWS 管理控制臺開始使用 Amazon Athena。 Amazon Athena 目前在美國東部(弗吉尼亞北部)和美國西部(俄勒岡)區(qū)域可用,并將在未來幾個月擴展到其他區(qū)域。
關(guān)于亞馬遜網(wǎng)絡(luò)服務(wù)
10 年來,Amazon Web Services 一直是世界上最全面、應(yīng)用最廣泛的云平臺。 AWS 在美國、澳大利亞、巴西、中國、德國的 14 個地理區(qū)域的 38 個可用區(qū) (AZ) 中為計算、存儲、數(shù)據(jù)庫、分析、移動、物聯(lián)網(wǎng) (IoT) 和企業(yè)應(yīng)用程序提供 70 多項功能齊全的服務(wù),愛爾蘭、日本、韓國、新加坡和印度。 AWS 服務(wù)受到全球超過 100 萬活躍客戶的信賴——包括發(fā)展最快的初創(chuàng)公司、最大的企業(yè)和領(lǐng)先的政府機構(gòu)——為他們的基礎(chǔ)設(shè)施提供支持、使其更加敏捷并降低成本。
關(guān)于亞馬遜
亞馬遜遵循四項原則:以客戶為中心而非以競爭對手為中心、對發(fā)明的熱情、對卓越運營的承諾以及長期思考??蛻粼u論、一鍵購物、個性化推薦、Prime、亞馬遜物流、AWS、Kindle Direct Publishing、Kindle、Fire 平板電腦、Fire TV、亞馬遜 Echo 和 Alexa 是亞馬遜率先推出的一些產(chǎn)品和服務(wù)。
點擊咨詢現(xiàn)在有哪些新興平臺值得關(guān)注 >>>
特別聲明:以上文章內(nèi)容僅代表作者本人觀點,不代表ESG跨境電商觀點或立場。如有關(guān)于作品內(nèi)容、版權(quán)或其它問題請于作品發(fā)表后的30日內(nèi)與ESG跨境電商聯(lián)系。
二維碼加載中...
使用微信掃一掃登錄
使用賬號密碼登錄
平臺顧問
微信掃一掃
馬上聯(lián)系在線顧問
小程序
ESG跨境小程序
手機入駐更便捷
返回頂部