這個模型我將他命名為群星閃耀。”
啊?這還真是大家都沒有想到的課題。
這類需求在國外的話,你還能看到,但是在國內,這尼瑪也太稀缺了,特定領域,僅限于文科領域的大模型,能派上什麼用場?
大家實在是想不到。
對林燃而言,他需要的就是這種,之所以命名為群星閃耀,象徵著這個模型未來放在月球背面的時候,能夠照亮人類群星。
這麼說,當1971年阿美莉卡試圖以一己之力脫離布雷頓森林協定的時候,人類經濟學家都不知道這意味著什麼的時候,群星閃耀能夠給予人類指引。
當蘇俄陷入困境,在經濟上艱難困苦,石油高企過去的時候,有群星閃耀能夠告訴他們,到底犯了什麼錯。
當華國,華國沒啥問題。
總之就是群星閃耀。
“我可以簡單和大家說一下,你們的工作可能涵蓋哪些內容,如果我來做,我會從什麼角度著手。
最重要的其實是數據,數據需要聚焦于高質量丶特定領域的文本,像哲學的倫理文本,形上學的著作,社會學的理論研究和實地調查報告,政治學的政策文件丶數據文本之類的。
你要找這些,總得知道到哪里去找論文索引,知道到哪里去找開放資源,如果這些不夠,要購買的話,到領域期刊去收集數據。
開放的數據收集完,如果需要,再聯系綜合部去找領域期刊收購他們完整資料庫的使用權。
我預計需要確保至少500億的tokens,來確保專業深度。
確定數據之后要對數據進行清洗吧,要去除噪聲重復以及具有偏見的內容。
一些文本也許很熱門,有超多引用或者下載,但實際上內容并無價值,這也需要大家來判斷。
這是數據階段要做的工作,在模型開發和訓練階段,你們可以直接用深紅來訓練,不需要從頭開發,直接讓工作人員協助你們基于現有模型進行訓練。
如果訓練結果不滿意,需要對模型調整,那麼你們可以先自己試試看,有什麼不懂的,你們發郵件給我,我安排時間來為大家提出解答。
我的目的是,希望大家能夠開放出一個,足夠中立客觀專業的模型,外界在使用的時候,丟任何一個社會議題給它,它都能給出足夠專業的解答。
如果足夠好的話,我會考慮把它賣給微博,成為微博社會議題的獨立客觀第三方意見。
所以,各位,你們的工作很有意義。”
林燃內心實際上在想,各位,不是很有意義,是非常有意義,它可能會改變整個時代的走勢,改變整個世界。
至于為什麼不自己做?
因為林燃在這個時空要呆很長一段時間,他不想專門花時間來做這個,丟給學生,在深紅現有資源下,當成是一個練手的課題恰好合適。
又不是這個暑假就要做完,會當成一個課題,一直推進,這屆做不完,新一批學生進來之后繼續做,本身交大的生源一年比一年好,林燃數學班的門檻也一年比一年高。
他要在這呆七年左右,時間綽綽有馀。
“大家通過這個課題,能夠接觸到幾乎所有的人工智慧大模型需要做的工作,我相信這對各位無論是現在還是未來,都會相當有幫助。”
最后群星閃耀上線后,在1960時空引發的影響暫且不表,在微博上,屬于是直接炸糞坑了,大把博主開始指責這款大模型既不客觀,也不中立,更不是什麼所謂第三方,完全是林燃個人意志的體現。
哪怕參與到其中的同學們,出來發文解釋,也連帶著被群起攻擊。
這是林燃也好,在座同學們也好,都始料未及的。
本章完</p>