上線這幾天,我比較感興趣的就是這個叫Consensus的GPT。
這是一個基于人工智能的研究助理,它檢索了Consensus(共識)網站上的2億篇學術論文,用戶可以問它某個主題有哪些論文,并且能給你這些論文的準確鏈接,找到出處鏈接。
作為關注數(shù)據存儲領域的內容編輯,我問了它關于閃存存儲有哪些論文。
它提到了這樣幾篇論文,看起來是分了三大類,其實都是用來提高NAND閃存性能和可靠性的。
我挑選了一個跟AI有關的論文,末尾還提供有論文的鏈接,它會把我引導到Consensus網站上。
AI讓我了解了這篇論文的大致信息,我很快就了解到:
傳統(tǒng)機器學習在NAND故障預測方面存在問題,基于預訓練的模型在某些NAND下表現(xiàn)可能很好,但換了NAND顆粒之后就不行了,為了重新適應新的NAND需要重新訓練模型,這很麻煩。
而新的叫LightWarner的無模型強化學習算法,算是一個故障預測器,可以動態(tài)學習閃存錯誤特性,它可以更快地適應不同閃存芯片,不同壽命周期的錯誤特性變化,從而降低模型遷移的成本。
論文中還提到,在對六種類型的3D閃存芯片進行評估時,LightWarner的表現(xiàn)比傳統(tǒng)監(jiān)督式機器學習方法故障預測準確率高了約10%。
這種高預測準確率意味著LightWarner能夠有效識別即將發(fā)生的故障,從而有助于提前采取措施,避免數(shù)據丟失或系統(tǒng)故障。
還能了解到,LightWarner的一個主要優(yōu)勢是其對不同閃存芯片類型的適應性,這使其在不斷變化和發(fā)展的存儲技術領域中具有重要的實用價值。
該模型還可以提升數(shù)據存儲系統(tǒng)的整體穩(wěn)定性和可靠性,對于如云計算、大數(shù)據分析領域也都有價值。
我比較好奇,這個強化學習的訓練過程是如何完成的?于是就試著追問了一下:
這里大致解釋了系統(tǒng)會收集各種數(shù)據,通過數(shù)據積累和對模型的優(yōu)化,一步步優(yōu)化模型,雖然講的很有條理,但與我想要的答案有些許偏差。
于是我試著問的更具體一點:
它列舉了可用于訓練的幾種方式,包括常用于訓練的各個芯片,還提到了用服務器和云基礎設施的方案,基本等于白問,估計論文里也沒有這些介紹。
最后,我問它,如果要把LightWarner部署,作用于SSD里,應該用什么方案,它是這么說的:
它的回答倒是很全面,幾種可能,以及要注意的點都列舉出來了。
由于我沒法直接從IEEE下載論文,最多也只能看到一點摘要信息,對照來看,GPT說的沒有明顯錯誤。
目前看來,Consensus對于希望快速了解有哪些論文,想快速了解論文大致要解決什么問題的人,還是很有幫助的。
如果有朋友對這個論文感興趣,可以試著自行下載獲取。多說一句,六位作者全都是國內大學的研究者,Consensus提到的其他論文的作者也都至少是華人居多。