• <li id="sssss"><table id="sssss"></table></li>
  • <li id="sssss"></li>
  • 立即搜索
    立即搜索
    VTA精準預判未來(lái)獎勵,多時(shí)間尺度神經(jīng)信號革新智能算法
    發(fā)布時(shí)間:2025-06-07
    作者:里來(lái)醫學(xué)

    大腦的一個(gè)小區域,稱(chēng)為腹側被蓋區 VTA),在我們處理獎勵的過(guò)程中發(fā)揮著(zhù)重要作用。它產(chǎn)生多巴胺,這是一種神經(jīng)調節物質(zhì),有助于我們根據環(huán)境線(xiàn)索預測未來(lái)的獎勵。來(lái)自 Genève大學(xué)、Harvard 大學(xué)和McGill大學(xué)聯(lián)合研究發(fā)現,VTA的功能遠比人們想象的更復雜:它不僅編碼預期的獎勵,還能精確到這一獎勵預計出現的時(shí)刻。這一發(fā)現得益于機器學(xué)習算法,展現了人工智能與神經(jīng)科學(xué)結合的巨大潛力。這項研究成果已發(fā)表于《Nature》期刊。

     

    VTA在動(dòng)機和大腦獎勵回路中扮演著(zhù)不可或缺的角色。作為多巴胺的主要來(lái)源,這一小簇神經(jīng)元將多巴胺傳遞到大腦的其他區域,以回應積極刺激并引發(fā)行動(dòng)。

    “最初,研究者認為VTA僅是大腦的獎勵信號處理中樞。但在20世紀90年代,科學(xué)家們發(fā)現它并不直接編碼獎勵本身,而是對獎勵的預測,”Genève大學(xué)教授A(yíng)lexandre Pouget解釋道。

     

    動(dòng)物實(shí)驗表明,獎勵總是出現在光信號之后,VTA釋放多巴胺的時(shí)機并不在獎勵出現的那一刻,而是在信號出現時(shí)。這表明VTA編碼的是與信號相關(guān)的獎勵預測,而不是獎勵本身。

    更復雜的功能

     

    這種需要最少監督的“強化學(xué)習”是人類(lèi)學(xué)習的核心。這也是許多通過(guò)訓練提升表現的人工智能算法的基礎原理,例如AlphaGo,這是第一個(gè)在圍棋比賽中擊敗世界冠軍的算法。

    在一項最新研究中,Alexandre Pouget的團隊與Harvard大學(xué)的Naoshige Uchida和McGill大學(xué)的Paul Masset合作,證實(shí)了VTA的編碼機制比之前更為復雜。“VTA不僅僅是預測未來(lái)獎勵的加權總和,而是預測它們的時(shí)間演變。換句話(huà)說(shuō),每個(gè)收益都是單獨表示的,并且都標記了其預期出現的精確時(shí)刻,”主導研究的Genève大學(xué)研究人員指出。

    “雖然我們知道VTA神經(jīng)元傾向于優(yōu)先考慮近期獎勵而非遠期獎勵,但我們發(fā)現不同的神經(jīng)元在處理時(shí)間尺度上有所不同,有些神經(jīng)元關(guān)注幾秒內可獲得的獎勵,有些則關(guān)注一分鐘后期望得到的獎勵,還有些則著(zhù)眼于更長(cháng)遠的目標。這種多樣性使得獎勵時(shí)間的編碼成為可能。這種更精細的表現為學(xué)習系統帶來(lái)了極大的靈活性,使其能夠根據個(gè)體的目標和優(yōu)先級來(lái)調整,以最大化提高即時(shí)或延遲的獎勵。”

    人工智能與神經(jīng)科學(xué):雙向互動(dòng)

    這些發(fā)現源于神經(jīng)科學(xué)與人工智能之間的富有成效的互動(dòng)。Alexandre Pouget開(kāi)發(fā)了一種純數學(xué)算法,該算法融入了獎勵處理的時(shí)間因素。同時(shí),Harvard 大學(xué)的研究團隊收集了大量關(guān)于動(dòng)物在體驗獎勵時(shí)VTA活動(dòng)的神經(jīng)生理數據。

    “他們將我們的算法應用于他們的數據,發(fā)現結果與他們的實(shí)證完全一致。”Alexandre Pouget表示。這項研究不僅印證了腦科學(xué)對人工智能的啟發(fā)作用,更證明了先進(jìn)算法反過(guò)來(lái)也能成為揭示神經(jīng)機制的有力工具。

    期刊:Nature

    DOI:10.1038/s41586-025-08929-9

     

    VTA精準預判未來(lái)獎勵,多時(shí)間尺度神經(jīng)信號革新智能算法
    發(fā)布時(shí)間:2025-06-07
    作者:里來(lái)醫學(xué)

    大腦的一個(gè)小區域,稱(chēng)為腹側被蓋區 VTA),在我們處理獎勵的過(guò)程中發(fā)揮著(zhù)重要作用。它產(chǎn)生多巴胺,這是一種神經(jīng)調節物質(zhì),有助于我們根據環(huán)境線(xiàn)索預測未來(lái)的獎勵。來(lái)自 Genève大學(xué)、Harvard 大學(xué)和McGill大學(xué)聯(lián)合研究發(fā)現,VTA的功能遠比人們想象的更復雜:它不僅編碼預期的獎勵,還能精確到這一獎勵預計出現的時(shí)刻。這一發(fā)現得益于機器學(xué)習算法,展現了人工智能與神經(jīng)科學(xué)結合的巨大潛力。這項研究成果已發(fā)表于《Nature》期刊。

     

    VTA在動(dòng)機和大腦獎勵回路中扮演著(zhù)不可或缺的角色。作為多巴胺的主要來(lái)源,這一小簇神經(jīng)元將多巴胺傳遞到大腦的其他區域,以回應積極刺激并引發(fā)行動(dòng)。

    “最初,研究者認為VTA僅是大腦的獎勵信號處理中樞。但在20世紀90年代,科學(xué)家們發(fā)現它并不直接編碼獎勵本身,而是對獎勵的預測,”Genève大學(xué)教授A(yíng)lexandre Pouget解釋道。

     

    動(dòng)物實(shí)驗表明,獎勵總是出現在光信號之后,VTA釋放多巴胺的時(shí)機并不在獎勵出現的那一刻,而是在信號出現時(shí)。這表明VTA編碼的是與信號相關(guān)的獎勵預測,而不是獎勵本身。

    更復雜的功能

     

    這種需要最少監督的“強化學(xué)習”是人類(lèi)學(xué)習的核心。這也是許多通過(guò)訓練提升表現的人工智能算法的基礎原理,例如AlphaGo,這是第一個(gè)在圍棋比賽中擊敗世界冠軍的算法。

    在一項最新研究中,Alexandre Pouget的團隊與Harvard大學(xué)的Naoshige Uchida和McGill大學(xué)的Paul Masset合作,證實(shí)了VTA的編碼機制比之前更為復雜。“VTA不僅僅是預測未來(lái)獎勵的加權總和,而是預測它們的時(shí)間演變。換句話(huà)說(shuō),每個(gè)收益都是單獨表示的,并且都標記了其預期出現的精確時(shí)刻,”主導研究的Genève大學(xué)研究人員指出。

    “雖然我們知道VTA神經(jīng)元傾向于優(yōu)先考慮近期獎勵而非遠期獎勵,但我們發(fā)現不同的神經(jīng)元在處理時(shí)間尺度上有所不同,有些神經(jīng)元關(guān)注幾秒內可獲得的獎勵,有些則關(guān)注一分鐘后期望得到的獎勵,還有些則著(zhù)眼于更長(cháng)遠的目標。這種多樣性使得獎勵時(shí)間的編碼成為可能。這種更精細的表現為學(xué)習系統帶來(lái)了極大的靈活性,使其能夠根據個(gè)體的目標和優(yōu)先級來(lái)調整,以最大化提高即時(shí)或延遲的獎勵。”

    人工智能與神經(jīng)科學(xué):雙向互動(dòng)

    這些發(fā)現源于神經(jīng)科學(xué)與人工智能之間的富有成效的互動(dòng)。Alexandre Pouget開(kāi)發(fā)了一種純數學(xué)算法,該算法融入了獎勵處理的時(shí)間因素。同時(shí),Harvard 大學(xué)的研究團隊收集了大量關(guān)于動(dòng)物在體驗獎勵時(shí)VTA活動(dòng)的神經(jīng)生理數據。

    “他們將我們的算法應用于他們的數據,發(fā)現結果與他們的實(shí)證完全一致。”Alexandre Pouget表示。這項研究不僅印證了腦科學(xué)對人工智能的啟發(fā)作用,更證明了先進(jìn)算法反過(guò)來(lái)也能成為揭示神經(jīng)機制的有力工具。

    期刊:Nature

    DOI:10.1038/s41586-025-08929-9

     

    久久国产欧美日韩精品图片_AV天堂亚洲区无码先锋影音_国产自在自线精品午夜视频_91精品国产成人综合_日韩AV无码免费一区二区