成人欧美一区二区三区,天天干天天操天天爱,免费特黄一级欧美大片在线看 ,亚洲中文字幕无码一区日日添

    <span id="alen4"></span>

    <li id="alen4"></li>

      生物界的ChatGPT:ProGen——開啟人工智能設(shè)計蛋白質(zhì)的新時代

      2022年11月30日,美國人工智能實驗室OpenAI發(fā)布ChatGPT。ChatGPT問世即一舉成名,引起全球熱議。微軟公司表示將把ChatGPT整合到搜索引擎Bing和網(wǎng)絡(luò)瀏覽器中,并向ChatGPT的創(chuàng)建者Open AI投資100億美元;此外ChatGPT成功面試谷歌編程;小說、劇作、漫畫ChatGPT也信手拈來。短短兩個多月,ChatGPT讓人驚嘆的表現(xiàn)不勝枚舉,人工智能新時代的序幕由此拉開。

       

      那么,ChatGPT到底是什么?ChatGPT:Chat Generative Pre-training Transformer,即預(yù)訓(xùn)練生成模型,它是能夠創(chuàng)建真實對話的深度學(xué)習(xí)語言模型。它以對話的方式進行交互,能夠回答連續(xù)性問題、承認錯誤并進行糾正、質(zhì)疑不正確的假設(shè),甚至拒絕不適當(dāng)?shù)恼埱?,是一款具?ldquo;學(xué)習(xí)”、“理解”和“思辨”能力的聊天機器人。
      圖片
      (圖片來源:https://learnchatgpt.com)
       
      ChatGPT的出現(xiàn)引發(fā)的這場AI風(fēng)暴,令我們不得不感慨人工智能發(fā)展之迅速。在生物領(lǐng)域,人工智能近年來也取得了矚目的成就。前幾年AlphaFold2的橫空出世,使蛋白質(zhì)結(jié)構(gòu)預(yù)測有了質(zhì)的飛躍,而今,ProGen的亮相又一次顛覆了蛋白質(zhì)設(shè)計的傳統(tǒng)認知。

       

      ProGen是由Salesforce Research、Tierra Biosciences 和加州大學(xué)的研究團隊共同開發(fā)的一種新型人工智能系統(tǒng),能從頭開始生成人工酶。研究團隊合成了ProGen預(yù)測生成的人工酶,并發(fā)現(xiàn)其具備天然酶的活性,首次打破了AI預(yù)測和實驗之間的壁壘,相關(guān)論文在《Nature Biotechnology》上發(fā)表。

       

      ProGen采用了基于標(biāo)簽的深度學(xué)習(xí)語言模型,用來自超過19000個家族的2.8億種不同蛋白質(zhì)的天然氨基酸序列進行訓(xùn)練,這些訓(xùn)練數(shù)據(jù)包含物種信息、蛋白質(zhì)家族、催化功能等屬性標(biāo)簽,使模型能將蛋白質(zhì)功能和序列信息進行映射,從而可生成具備預(yù)測功能的蛋白質(zhì)序列。ProGen使從頭設(shè)計蛋白質(zhì)就像遣詞造句一樣簡單,給定功能標(biāo)簽和屬性等關(guān)鍵詞,即可大批量生成蛋白質(zhì)序列。
      圖片
      (圖片來源:Nature Biotechnology)
       
      創(chuàng)始人Ali Madani和其他研究人員通過ProGen生成人工溶菌酶,與天然溶菌酶的蛋白質(zhì)序列一致性僅為31.4%,但實驗結(jié)果令人驚訝,該人工溶菌酶與天然溶菌酶具有相似的催化效果。由ProGen生成的人工酶的催化效果在其他蛋白質(zhì)家族,比如在分支酸變位酶和蘋果酸脫氫酶中同樣得到了驗證。
      圖片
      (圖片來源:Nature Biotechnology)
       
      無論是ChatGPT還是ProGen,其背后的算法均是一種完全基于“自注意力機制”的深度學(xué)習(xí)模型。深度學(xué)習(xí)語言模型正在蛋白質(zhì)設(shè)計和改造領(lǐng)域如火如荼地進行,翌圣生物也在AI輔助蛋白質(zhì)改造領(lǐng)域進行了探索。翌圣ZymeEditorTM平臺是翌圣生物酶進化研發(fā)中心六大核心技術(shù)平臺之一,它將理性設(shè)計、定向進化與人工智能技術(shù)有機結(jié)合、交互篩選,是高效、系統(tǒng)、創(chuàng)新型的蛋白質(zhì)進化平臺。
       

       

      翌圣ZymeEditorTM平臺的理性設(shè)計技術(shù)具備蛋白質(zhì)建模、分子對接、分子動力學(xué)模擬等技術(shù)模塊,并結(jié)合人工智能深度學(xué)習(xí)語言模型,對蛋白質(zhì)進行精準改造,具有準確度高、耗時短、成本低等優(yōu)勢。翌圣ZymeEditorTM平臺的超高通量定向進化技術(shù),則可構(gòu)建優(yōu)質(zhì)、超大突變文庫,進行自動化、智能化的超高通量篩選,可快速、準確獲得具備特定功能的有益突變體。翌圣ZymeEditorTM平臺的人工智能技術(shù)將理性設(shè)計與定向進化濕實驗產(chǎn)生的龐大的蛋白質(zhì)實驗數(shù)據(jù)作為機器學(xué)習(xí)的數(shù)據(jù)訓(xùn)練集,更加真實可靠,從而訓(xùn)練出更適合分子酶的語言模型。ZymeEditorTM平臺目前已完成130余種高端分子酶的改造和進化,具備扎實的開發(fā)高端分子酶的技術(shù)基礎(chǔ)。
       
      圖片
      圖:翌圣ZymeEditorTM平臺
       

       

      參考文獻

       
      [1]Madani A, Krause B, Greene ER, Subramanian S, Mohr BP, Holton JM, Olmos JL Jr, Xiong C, Sun ZZ, Socher R, Fraser JS, Naik N. Large language models generate functional protein sequences across diverse families. Nat Biotechnol. 2023 Jan 26. doi: 10.1038/s41587-022-01618-2. Epub ahead of print. PMID: 36702895.
      [2]Madani A, McCann B, Naik N, Keskar NS, Anand N, Eguchi RR, Huang PS, Socher R. ProGen: language modeling for protein generation. BioRxiv。2022 Mar 7. doi: https://doi.org/10.1101/2020.03.07.982272.
      [3]Jumper J, Evans R, Pritzel A, Green T, Figurnov M, Ronneberger O, Tunyasuvunakool K, Bates R, ?ídek A, Potapenko A, Bridgland A, Meyer C, Kohl SAA, Ballard AJ, Cowie A, Romera-Paredes B, Nikolov S, Jain R, Adler J, Back T, Petersen S, Reiman D, Clancy E, Zielinski M, Steinegger M, Pacholska M, Berghammer T, Bodenstein S, Silver D, Vinyals O, Senior AW, Kavukcuoglu K, Kohli P, Hassabis D. Highly accurate protein structure prediction with AlphaFold. Nature. 2021 Aug;596(7873):583-589. doi: 10.1038/s41586-021-03819-2. Epub 2021 Jul 15. PMID: 34265844; PMCID: PMC8371605.
      [4]ChatGPT: Optimizing Language Models for Dialogue: https://openai.com/blog/chatgpt/
      [5]Radford A, Narasimhan K,Salimans T, Sutskever I.Improving Language Understanding by Generative Pre-Training.
      [6]Tools such as ChatGPT threaten transparent science; here are our ground rules for their use. Nature. 2023 Jan;613(7945):612. doi: 10.1038/d41586-023-00191-1. PMID: 36694020.
      [7]Riesselman AJ, Ingraham JB, Marks DS. Deep generative models of genetic variation capture the effects of mutations. Nat Methods. 2018 Oct;15(10):816-822. doi: 10.1038/s41592-018-0138-4. Epub 2018 Sep 24. PMID: 30250057; PMCID: PMC6693876.
      [8]University of California - San Francisco. "AI technology generates original proteins from scratch: Natural language model jumpstarts protein design with creation of active enzymes." ScienceDaily. ScienceDaily, 26 January 2023..
      [9]Stokel-Walker C. AI bot ChatGPT writes smart essays - should professors worry? Nature. 2022 Dec 9. doi: 10.1038/d41586-022-04397-7. Epub ahead of print. PMID: 36494443.

      400-6111-883