上線這幾天,我比較感興趣的就是這個(gè)叫Consensus的GPT。
這是一個(gè)基于人工智能的研究助理,它檢索了Consensus(共識(shí))網(wǎng)站上的2億篇學(xué)術(shù)論文,用戶(hù)可以問(wèn)它某個(gè)主題有哪些論文,并且能給你這些論文的準(zhǔn)確鏈接,找到出處鏈接。
作為關(guān)注數(shù)據(jù)存儲(chǔ)領(lǐng)域的內(nèi)容編輯,我問(wèn)了它關(guān)于閃存存儲(chǔ)有哪些論文。
它提到了這樣幾篇論文,看起來(lái)是分了三大類(lèi),其實(shí)都是用來(lái)提高NAND閃存性能和可靠性的。
我挑選了一個(gè)跟AI有關(guān)的論文,末尾還提供有論文的鏈接,它會(huì)把我引導(dǎo)到Consensus網(wǎng)站上。
AI讓我了解了這篇論文的大致信息,我很快就了解到:
傳統(tǒng)機(jī)器學(xué)習(xí)在NAND故障預(yù)測(cè)方面存在問(wèn)題,基于預(yù)訓(xùn)練的模型在某些NAND下表現(xiàn)可能很好,但換了NAND顆粒之后就不行了,為了重新適應(yīng)新的NAND需要重新訓(xùn)練模型,這很麻煩。
而新的叫LightWarner的無(wú)模型強(qiáng)化學(xué)習(xí)算法,算是一個(gè)故障預(yù)測(cè)器,可以動(dòng)態(tài)學(xué)習(xí)閃存錯(cuò)誤特性,它可以更快地適應(yīng)不同閃存芯片,不同壽命周期的錯(cuò)誤特性變化,從而降低模型遷移的成本。
論文中還提到,在對(duì)六種類(lèi)型的3D閃存芯片進(jìn)行評(píng)估時(shí),LightWarner的表現(xiàn)比傳統(tǒng)監(jiān)督式機(jī)器學(xué)習(xí)方法故障預(yù)測(cè)準(zhǔn)確率高了約10%。
這種高預(yù)測(cè)準(zhǔn)確率意味著LightWarner能夠有效識(shí)別即將發(fā)生的故障,從而有助于提前采取措施,避免數(shù)據(jù)丟失或系統(tǒng)故障。
還能了解到,LightWarner的一個(gè)主要優(yōu)勢(shì)是其對(duì)不同閃存芯片類(lèi)型的適應(yīng)性,這使其在不斷變化和發(fā)展的存儲(chǔ)技術(shù)領(lǐng)域中具有重要的實(shí)用價(jià)值。
該模型還可以提升數(shù)據(jù)存儲(chǔ)系統(tǒng)的整體穩(wěn)定性和可靠性,對(duì)于如云計(jì)算、大數(shù)據(jù)分析領(lǐng)域也都有價(jià)值。
我比較好奇,這個(gè)強(qiáng)化學(xué)習(xí)的訓(xùn)練過(guò)程是如何完成的?于是就試著追問(wèn)了一下:
這里大致解釋了系統(tǒng)會(huì)收集各種數(shù)據(jù),通過(guò)數(shù)據(jù)積累和對(duì)模型的優(yōu)化,一步步優(yōu)化模型,雖然講的很有條理,但與我想要的答案有些許偏差。
于是我試著問(wèn)的更具體一點(diǎn):
它列舉了可用于訓(xùn)練的幾種方式,包括常用于訓(xùn)練的各個(gè)芯片,還提到了用服務(wù)器和云基礎(chǔ)設(shè)施的方案,基本等于白問(wèn),估計(jì)論文里也沒(méi)有這些介紹。
最后,我問(wèn)它,如果要把LightWarner部署,作用于SSD里,應(yīng)該用什么方案,它是這么說(shuō)的:
它的回答倒是很全面,幾種可能,以及要注意的點(diǎn)都列舉出來(lái)了。
由于我沒(méi)法直接從IEEE下載論文,最多也只能看到一點(diǎn)摘要信息,對(duì)照來(lái)看,GPT說(shuō)的沒(méi)有明顯錯(cuò)誤。
目前看來(lái),Consensus對(duì)于希望快速了解有哪些論文,想快速了解論文大致要解決什么問(wèn)題的人,還是很有幫助的。
如果有朋友對(duì)這個(gè)論文感興趣,可以試著自行下載獲取。多說(shuō)一句,六位作者全都是國(guó)內(nèi)大學(xué)的研究者,Consensus提到的其他論文的作者也都至少是華人居多。