發(fā)布時(shí)間:2021-12-28 15:50:19來(lái)源:有考培訓(xùn)網(wǎng)綜合
上海Java培訓(xùn)機(jī)構(gòu)推薦哪家?“職坐標(biāo)”平臺(tái)是海同科技以14年教學(xué)經(jīng)驗(yàn)傾心打造的以“項(xiàng)目實(shí)訓(xùn)”模式為核心的教學(xué)平臺(tái)。與2000+企業(yè),包括阿里、華為、海信、交通銀行、今日頭條等企業(yè)進(jìn)行人才服務(wù)合作;同時(shí),也與300+高校達(dá)成合作,為全國(guó)高校師生提供優(yōu)質(zhì)課程資源、督學(xué)服務(wù)和平臺(tái)支持。
1、WikipediaSearch。
一部大眾百科全書應(yīng)該運(yùn)行在開源軟件上,并且具有一個(gè)由Java驅(qū)動(dòng)的搜索引擎,這是再合適不過(guò)的了。Lucene是由DougCutting于1999年編寫,并以他妻子的中間名命名的,它實(shí)際上是Cutting開發(fā)的第五個(gè)搜索引擎。他作為工程師先后為XeroxPARC(施樂(lè)帕克研究中心)、Apple和Excite創(chuàng)建了其他的引擎。2014年,Wikipedia用Elasticsearch代替了Lucene引擎,Elasticsearch是一個(gè)分布式的、支持REST的搜索引擎,也是用Java編寫的。
2、Hadoop。
Lucene并不是一個(gè)進(jìn)入我們這個(gè)榜單的Cutting創(chuàng)建的作品。2003年,Google在一篇研究論文中描述了在大型商用計(jì)算機(jī)集群上處理數(shù)據(jù)的MapReduce算法,受該論文的啟發(fā),Cutting用Java編寫了一個(gè)MapReduce操作開源框架,并以他兒子的玩具大象命名,稱為Hadoop。Hadoop1.0于2006年發(fā)布,催生了大數(shù)據(jù)趨勢(shì),并激發(fā)了許多公司開始收集“數(shù)據(jù)湖”(datalakes),制定挖掘“數(shù)據(jù)排放”(dataexhaust)的策略,并將數(shù)據(jù)描述為“新石油”(thenewoil)。到2008年,Yahoo(當(dāng)時(shí)的Cutting曾在該公司工作)宣稱他們的SearchWebmap運(yùn)行在10,000個(gè)內(nèi)核的Linux群集上,是現(xiàn)有的較大的產(chǎn)線Hadoop應(yīng)用程序。到2012年,F(xiàn)acebook聲稱在全球較大的Hadoop集群上擁有超過(guò)100PB的數(shù)據(jù)。
3、并行圖形分析(ParallelGraphAnalytiX,PGX)。
圖形分析是有關(guān)理解數(shù)據(jù)中的關(guān)系和連接的。根據(jù)基準(zhǔn)測(cè)試,PGX是世界上速度較快的圖形分析引擎之一。PGX是用Java編寫的,由OracleLabs研究員SungpackHong領(lǐng)導(dǎo)的團(tuán)隊(duì)于2014年首次發(fā)布,PGX允許用戶加載圖形數(shù)據(jù)并運(yùn)行分析算法,比如,社區(qū)發(fā)現(xiàn)(CommunityDetection)、聚類、路徑查找、頁(yè)面排名、影響因素分析、異常檢測(cè)、路徑分析和模式匹配等算法。在健康、安全、零售和金融領(lǐng)域,它的用例比比皆是。
4、H2O.ai。
機(jī)器學(xué)習(xí)(ML)的曲線非常陡峭,這可能會(huì)阻止領(lǐng)域?qū)崿F(xiàn)偉大的ML想法。自動(dòng)化ML(AutoML)可以通過(guò)推斷ML流程中的某些步驟(例如特征工程、模型訓(xùn)練和調(diào)整以及轉(zhuǎn)譯等)來(lái)提供一些幫助。由JavaCliffClick創(chuàng)建的基于Java的開源H2O.ai平臺(tái),旨在實(shí)現(xiàn)AI的大眾化,并能為那些剛?cè)腴T的人們充當(dāng)虛擬數(shù)據(jù)科學(xué)家,同時(shí)能幫助ML提率。