icon fsr

雑誌目次

雑誌文献

生体の科学64巻4号

2013年08月発行

雑誌目次

特集 予測と意思決定の神経科学

特集“予測と意思決定の神経科学”に寄せて

著者: 岡本仁

ページ範囲:P.294 - P.296

 われわれは日々の生活で,様々な行動の選択に関する意思決定を常に行いながら生きている。ほとんどの場合,人間を含むすべての動物は,自らの生存に最適な環境を得られると予測できる行動を選択する。この場合,より良い食物や住み心地の良い環境など,個体の生存に取って好ましいもの(報酬)が得られる可能性を最大にしようとする場合もあれば,生存を脅かす天敵の攻撃の可能性や餌が乏しい環境など,個体の生存を脅かすもの(罰)を最小限に食い止めようとする場合もあるだろう。動物は成功と失敗の経験を繰り返すうちに,最適の行動を選択することができるようになる。

 機械やコンピューターに,このような行動様式を実現させるための学習制御の理論に,Actor-Critic(ここでは,動作者―評価者と仮に訳す)型強化学習理論がある。この理論では行動の制御は評価者(critic)と動作者(actor)の二者によって行われているとする。評価者は“動作者が特定の行動を選択するときに,その時点で将来にわたって得られると期待される報酬の大きさ”を予測し,“行動を選択した結果,実際に得られた報酬の大きさ”との差(予測誤差)を,行動を行うたびに計算する。その結果,評価者は予測誤差に比例して将来への報酬の期待値を修正すると同時に動作者にもこの値を伝えて,動作者は,この値に比例して行動を選択する確率を変化させる。Actor-Critic型強化学習理論は,このようにして期待値と行動の選択確率の修正を行っていけば,最終的には評価者は将来の報酬を正確に予測できるようになり,なおかつ動作者は報酬が最大となる行動を選択できるようになることを教えてくれている。このような理論は,ある時点で予測される将来の報酬の期待値の総和と,次の時点での実際に得られた報酬と将来の報酬の期待値の総和の差(temporal difference;TD)が,理論の中心となるためTemporal Difference Theoryとも呼ばれる1)

脳内シミュレーションと意思決定の神経回路

著者: 銅谷賢治

ページ範囲:P.297 - P.300

 日々の行動から人生の選択に至るまで,人がどのような原理とメカニズムにより意思決定を行っているのかは,哲学から心理学,経済学,政治学,脳科学,精神医学にわたる大きな問題である。人の意思決定への科学的アプローチは,長らく哲学的考察と行動学的記述に限られてきたが,近年の非侵襲脳活動計測技術と行動学習の計算理論を統合した研究により,意思決定に必要な計算処理にかかわる脳部位が具体的に明らかになりつつある。さらに各種の実験動物で,それらに相当する脳部位での神経活動を詳細に記録し操作する技術により,意思決定の過程を神経細胞のなす回路の機能として解明することが現実的な可能性となりつつある。

 筆者らは2011年度から文部科学省新学術領域研究「予測と意思決定」を立上げ,論理学や機械学習理論,人の行動解析と脳活動計測,実験動物での神経活動の計測と操作技術を統合し,意思決定の神経回路機構を解明することを目指して研究を進めている(http://www.decisions.jp)。本稿ではその研究の基盤となる意思決定の理論と,主要な研究課題について紹介する。

意思決定にかかわる二つの神経回路

著者: 坂上雅道

ページ範囲:P.301 - P.308

 意思決定とは複数の選択肢の中から,より良い結果をもたらすものを選び出し,実行することである。選択肢がもたらすと予想される報酬と罰の総和を価値と呼び,この価値の生成プロセスがわれわれの意思決定を特徴づける。近年の心理学・神経科学的研究は,われわれの脳の中に複数の意思決定プロセスが存在することを明らかにしつつある。事象と報酬の経験的関係を客観的・確率的に結び付けて価値を計算するプロセスは,モデルフリーシステムと呼ばれ,直接経験によって形成された連合を概念や論理によって結び付け,直接経験していない価値の予測を可能にするプロセスは,モデルベースシステムと呼ばれる1-3)。最終的な意思決定は,これらのプロセスの協調と競合によって成り立っている。特に,ヒトを特徴づける複雑な判断能力は,シミュレーション可能な内部モデルを持つモデルベースシステムにあると考えられる。この機能の理解はヒトの意思決定や思考の特徴の理解につながり,ひいては人間の科学的理解にもつながる。しかし,どのような神経メカニズムがそれを可能にしているのかについては,まだほとんどわかっていない。ここでは,最近われわれが行った,ヒトを被験者としたfMRI実験,サルを被験体として,前頭前野と大脳基底核線条体から記録を行った電気生理学実験を紹介しながら,モデルベース的意思決定の神経メカニズムについて議論する。

報酬予測を作る大脳基底核回路の形態学的解明

著者: 藤山文乃

ページ範囲:P.309 - P.313

 1997年のSchultzらによるサルの電気生理の仕事から,中脳にあるドーパミンニューロンが報酬の予測からのずれ(報酬予測誤差)に応答していることが知られるようになった1)。また,Wickensらはドーパミン投射を受ける線条体ニューロンにおいて,大脳皮質からの入力と黒質からのドーパミン入力に依存するシナプス可塑性が起こることを報告した2)。これらの報告から線条体シナプスは報酬予測誤差に依存した可塑性を引き起こし,大脳基底核の回路を使って時々刻々更新される強化学習を行っているという仮説が提案された3-5)

 この強化学習における線条体内の役割分担を提唱したのがBartoらで,彼らは線条体のストリオソーム・マトリックス構造に着目し,actor-critic仮説を提唱した4)。この説によると線条体のマトリックスは基底核出力部位(淡蒼球内節/黒質網様部)を通じて行動選択を行い(actor),ストリオソームは報酬予測を行い(critic),その投射先のドーパミンニューロンで報酬予測誤差が計算され,そのドーパミンニューロンがさらに線条体へ投射することによってactor-critic学習が行われる。

報酬・忌避行動と意思決定における大脳基底核神経回路機構

著者: 疋田貴俊

ページ範囲:P.314 - P.318

 われわれは周囲の感覚入力と今までの経験を基に,次に身に降りかかる事象を予測し,その予測に基づいて意思決定を行っている。特に,報酬・忌避シグナルを予測し意思決定を行う報酬行動・忌避行動は強化学習を伴う大脳基底核機能として研究が進められている1,2)。報酬および報酬予測に対しては腹側被蓋野のドーパミン細胞がバースト発火をし,側坐核にドーパミンが放出される3)。一方,忌避刺激とその予測あるいは報酬予測に合わない無報酬の結果に対しては腹側被蓋野の多くのドーパミン細胞が一時的に発火を止める4)。すなわちドーパミン細胞が報酬予測に対して発火パターンを変え,また,予測誤差を検出することによって強化学習を行っていることが明らかになってきている5)。それに対してドーパミンの受け手である側坐核ではどのような情報伝達を行い,予測に基づく意思決定行動へとつなげているのかは不明であった。われわれは大脳基底核の特定の神経回路を可逆的に遮断する可逆的神経伝達阻止法を開発し,報酬・忌避行動と意思決定における大脳基底核神経回路機構の解析を進めている。

中脳における報酬予測誤差計算機構

著者: 小林康 ,   岡田研一

ページ範囲:P.319 - P.322

 われわれは試行錯誤を繰り返し,自分の置かれた環境からなるべく多くの報酬を得ようと予測的に行動する。この報酬に基づく適応的予測更新過程は強化学習と呼ばれているが,そのとき脳内では何が起こっているのであろうか。長年にわたる研究の積み重ねから,中脳のドーパミン細胞(DA cell)が,強化学習に重要な役割を果たすことが明らかになってきた。DA cellは報酬で条件付けされた手がかり刺激や報酬に対して活動し,DA cellの活動の結果放出されたドーパミンによって出力先のシナプス可塑性が制御され報酬予測の更新が起こり,手がかかり刺激と行動報酬の連合による強化学習が進行していくと考えられている。まさにDA cellは強化学習の教師である。DA cellに対する脳幹の入力信号から強化学習について述べたい。

報酬構造学習―ドーパミン神経細胞をめぐる新仮説

著者: 中原裕之

ページ範囲:P.323 - P.328

 われわれの日常生活は,朝食に何を食べるか,職場で上司に何を報告するかなど,意思決定の連続である。意思決定は未来に影響を与える。逆に言えば未来予測が意思決定の際には働く。このように未来予測の学習は意思決定において本質的な役割を果たすことになる。経験から予測を修正,つまり学習することが適応的な意思決定を可能にするのである。予測の中でも,報酬の予測はヒトや動物にとって原初的な部類に属する。報酬予測は動機づけ行動の土台ともなる1-4)。そのため,報酬予測の学習とその意思決定“価値に基づく意思決定;value-based decision making”(以下,価値意思決定)における脳機能の解明は神経科学の重要なテーマとなっている。近年,この価値意思決定に関する脳研究が報酬予測の脳計算理論“強化学習;reinforcement learning theory”に支えられ発展してきた。そこでは,いわゆるドーパミン報酬予測誤差仮説が大きな役割を演じている5)。本稿では,われわれが先ごろ新たに提唱した“ドーパミン報酬構造学習仮説”を紹介する。

意思決定神経回路の可視化と操作

著者: 青木田鶴 ,   岡本仁

ページ範囲:P.329 - P.333

 状況に応じた行動選択と意思決定は,大脳皮質―基底核回路と中脳ドーパミン神経細胞群の働きにより支えられていると考えられており,大脳皮質―基底核回路を中心とした学習モデルも数多く作成されている。しかしながら,大脳皮質―基底核回路は複数の神経核を含み,実際にどのようなメカニズムにより意思決定がなされるのか,その全容は明らかではない。本稿ではゼブラフィッシュをモデル動物として,カルシウムイメージング法や光遺伝学(optogenetics)を駆使し,意思決定神経回路のメカニズムを解明する可能性について解説する。

セロトニン神経系の障害を伴う精神疾患における意思決定神経基盤の解明

著者: 酒井雄希 ,   成本迅

ページ範囲:P.334 - P.337

 セロトニン神経系の障害は様々な精神疾患で報告されている。特に強迫性障害を中心とする強迫スペクトラム障害(図1)に分類される精神疾患では,選択的セロトニン再取り込阻害薬(selective serotonin reuptake inhibitor;SSRI)が効果を発揮することなどから,セロトニン神経系の障害が症状発現と関連していると想定されている。強迫性障害は長時間の手洗いや確認といった繰り返しの強迫行為が特徴である。過食症では食べることをやめることができず,自分では制御できないという症状が特徴で,抜毛症でも体毛を抜く行為が繰り返される。衝動性を背景とした繰り返しの行動が症状の特徴である。これらの疾患では患者自身も不合理,もしくは無意味だと感じている観念や衝動が強い不安を伴って繰り返し現れ,それに対して不安や衝動の一時的な解消という短期的な目先の報酬が得られる行動を繰り返し選択してしまうという意思決定の異常がみられる。

 意思決定については,すぐに得られる小さな報酬と,得るのに時間がかかる大きな報酬のどちらかを選択するという“異時点間の選択問題”を用いた研究が進んでいる。すぐに得られる報酬を過度に頻繁に選ぶ“衝動的選択”は衝動性をとらえる指標の一つとされ,セロトニン機能低下や前頭葉や線条体といった脳領域の障害で引き起こされることが知られている1,2)。Tanakaらは,この衝動的選択とセロトニン,および線条体との関連について,ヒトにおいて食事中のトリプトファンを調整することで健常者に低セロトニン状態と高セロトニン状態を作り,それぞれの状態で異時点間の選択問題を解く課題を遂行中の脳活動をfunctional MRI(fMRI)により測定することで明らかにした。脳活動の時系列データは計算論モデルに基づいて解析され,線条体・島皮質において,腹側が衝動的な短期報酬予測に関与し,背側が長期報酬予測に関与することと,セロトニン濃度が低いときは短期報酬予測に関連した腹側の活動が優位になることを報告している3,4)

情動的意思決定の分子神経イメージング

著者: 高橋英彦

ページ範囲:P.338 - P.341

 fMRI(functional magnetic resonance imaging;磁気共鳴機能画像法)を中心とした非侵襲的脳イメージングの流布や認知科学の進歩により,医学や神経科学領域以外の研究者も神経科学研究を精力的に行っている。特に,情動,意思決定,意識といったこれまでどちらかと言うと心理学,経済学,哲学といった人文社会分野が扱っていた研究テーマを神経科学的に研究しようとする融合分野が推進され,本特集の著者の多くが参画している新学術領域“予測と意思決定の脳内計算機構の解明による人間理解と応用”においても様々なバックグラウンドの研究者が分野横断研究を行っている。なかでも神経経済学と呼ばれる研究領域は国際学会も設立され,非常に興隆している。神経経済学が興隆してきた一段階前の背景としては行動経済学や実験経済学の確立という事実がある1)

 伝統的な経済学では数式や公理に基づき,意思決定者は個人の利得を最大限になるように“合理的”に振る舞うと想定してきた。しかし,実際の人間の行動は,必ずしも“合理的”ではなく,ときに期待値を計算すると不利な宝くじを購入したり,寄付や協力行為を行ったりする。このように血の通った人間においては,ときに“非合理”あるいは“情動的”な意思決定を行い,情動・同情・モラル・使命感なども意思決定に重要な役割を担っているということが行動経済学・実験経済学で実証されてきた。行動経済学は言ってみれば,伝統的な経済学に認知科学,心理学が融合した学問とも考えることも可能で,実際,2002年に行動経済学の開拓,確立した理由でノーベル経済学賞を受賞したKahnemanも元来は心理学者である。行動経済学と神経科学が融合したのが神経経済学とも言える。これまでのfMRIを用いた神経経済学は“非合理”あるいは“情動的”な意思決定の認知神経学的なメカニズムを明らかにしてきた。次の研究段階としては,この過程に報酬系と呼ばれるドーパミンを中心にした神経伝達物質がどのようにかかわっているか明らかにする必要がある。次に最近の筆者らの分子イメージングによるアプローチの研究の成果を中心に紹介したい。

腹側淡蒼球と報酬予測

著者: 橘吉寿 ,   彦坂興秀

ページ範囲:P.342 - P.347

 われわれの行動の多くは,おいしい食物,金銭,名誉や達成感といった様々なレベルでの報酬の獲得を目指して営まれている。では,このような報酬に基づく行動制御を可能としている脳部位は一体どこなのであろうか? これまでの研究から,このような報酬に基づく行動意思決定には,大脳基底核が強く関与しうることが示唆されている。なかでも,今回,筆者らは大脳基底核の腹側淡蒼球に備わる報酬予測機能に注目した。本稿では腹側淡蒼球の解剖・生理を概説したうえで,腹側淡蒼球が担う報酬予測に基づいた行動(運動)制御機能について解説したい。

報酬・罰を伝達するドーパミン神経と記憶の局所回路

著者: 谷本拓

ページ範囲:P.348 - P.353

 これまで経験した感覚情報を統合し,学習した“記憶”に基づき適切な行動をとることは,動物界に広くみられる脳・神経系の本質的な機能の一つである。その複雑な過程の一端を担う脳機能が,特定の刺激と状況を結び付ける連合学習である。報酬・罰などの情動を伴う刺激(正・負の強化因子)が連合記憶の形成を駆動する。このため,連合学習系は報酬・罰が脳内で処理される過程を研究する際に用いられる。ここではショウジョウバエの嗅覚連合学習における報酬・罰を伝達する神経の機能解析についての最近の研究を紹介する。これら神経の同定の背景には,ショウジョウバエ特有の神経回路の機能を操作する遺伝学的技術が大きな役割を果たしてきた。そこで,行動学研究に頻繁に用いられるショウジョウバエの非侵襲的神経操作技術についても解説する。

線虫C. elegansにおけるモノアミンによる神経制御

著者: 笹倉寛之 ,   森郁恵

ページ範囲:P.354 - P.359

線虫C. elagansの神経系

 線虫C. elegansは1960年代にSydney Brenner博士によって,発生の仕組みと神経系機能の解明に適するモデル生物として選ばれた1)。発生に関しては,2002年に「器官発生とプログラム細胞死の遺伝制御」の研究で,John Sulston,Robert Horvitz両博士と共にノーベル生理医学賞を受賞している。神経系については,Brenner博士が1960年代当初からシステムバイオロジー的な研究戦略を持っていたことはあまり知られていない。神経の配線すべてを明らかにしてneural computationを解読し,究極的にはコンピューターシュミレーションによって行動を再現する構想を描いていた。自伝「My Life in Science」に書かれているように,ある時期コンピューターに没頭したことが,この着想に大きな影響を与えたのである。偶然か必然か,おおむね彼の構想に従ってサイエンスが動いており,その先見性は驚愕と言うしかない。

 線虫は302個の神経細胞からなり,Whiteらによる電子顕微鏡解析から約5,000個のシナプス,約600個のギャップジャンクションからなる全神経接続が明らかにされている2)。哺乳類の神経系で使われている主要な神経伝達物質,グルタミン酸,アセチルコリン,GABA,モノアミン類などが線虫に存在している3-7)。イオンチャネルも,哺乳類のイオンチャネルのホモログが多数存在するが,ゲノム上に電位依存型Naチャネルの遺伝子は存在せず,線虫では活動電位は生じないと考えられている3)。とは言え,神経回路での速い電気的伝播は可能であり,Ca2+電流が重要な役割を果たしていると考えられる8)。一般に神経細胞内にイオンが流入した後に種々のプロテインキナーゼが活性化されるが,CAMKII,CAMKIV,PKA,PKC,PKG,MAPKなど,哺乳類のプロテインキナーゼのホモログが線虫に多数存在している。

連載講座 細胞増殖・4

サイクリンB2の細胞内局在と紡錘体形成

著者: 吉留賢 ,   古野伸明

ページ範囲:P.360 - P.365

 サイクリンB(CycB)はサイクリン依存性キナーゼ1(CDK1,Cdc2キナーゼ)と複合体を形成し,卵成熟/M期促進因子(Maturation/M-phase promoting factor;MPF)としてM期の進行を制御する。脊椎動物の二つのCycBサブタイプのうち,CycB1がM期の進行に必須で,B2は必要ないとされてきたが,近年それを否定する結果が出ている。しかし,CycB2がどのような機能を有するのかほとんどわかっていない。本稿では,われわれが得たアフリカツメガエル(Xenopus laevis)卵成熟におけるCycB2の局在依存的な紡錘体形成能を中心にM期におけるB2の機能を論じたい。

解説

Gタンパク質共役型受容体の進化

著者: 柳川正隆 ,   七田芳則

ページ範囲:P.366 - P.374

 Gタンパク質共役型受容体(G protein-coupled receptor;GPCR)は,ヒトゲノム上に約800種の遺伝子が同定されており,創薬の主要なターゲットとして注目されている。GPCRは7回膜貫通領域という共通の構造ドメインを持ち,細胞外の刺激を受容して三量体Gタンパク質を介した細胞内シグナル伝達系を駆動する。GPCRが受容する刺激は,光・匂い・味・神経伝達物質・イオン・ホルモンなど多岐にわたっており,刺激を受容する部位(リガンド結合部位)に関して多様化している。本稿では進化の過程でいかにしてGPCRが多様化し,一大スーパーファミリーを形成するに至ったのかについて,近年のゲノム解析の知見を交えて概説する。さらに,機能解析の進んでいる光受容体オプシン類の多様性を紹介し,われわれの視覚・非視覚系における光受容機構がどのように獲得されてきたかを議論する。また,オプシン類とはアミノ酸配列の相同性が乏しく,進化的に遠縁にあたる代謝型グルタミン酸受容体ファミリーが,いかにして共通のGタンパク質を活性化するのかという疑問に対して,構造機能相関の視点から議論したい。

--------------------

次号予告/財団だより

ページ範囲:P.347 - P.375

あとがき

著者: 岡本仁

ページ範囲:P.376 - P.376

 脳が,その場その場の状況に応じて行動プログラムを正しく選択し,意思決定を行えることは,われわれが日常生活を営むうえで不可欠です。この行動プログラムの選択をうまく行えない人は,いわゆる“空気が読めない”人とみなされてしまいます。更には,強迫神経症や統合失調症,自閉症などの精神疾患でみられる固執,妄執,繰り返しなどの異常行動も,行動選択と意思決定の脳回路の異常作動と深くかかわると推定できます。

 現代の脳科学は,このような神経回路の作動の正常と異常の仕組みの解明に迫れる段階まで達してきました。このことは心の解明への第一歩と言えるでしょう。執筆陣の先生方に深く感謝すると共に,諸先生方の熱意が読者に伝わることを願っています。また,連載講座・細胞増殖とGタンパク質共役受容体の進化に関する解説で,力のこもった解説を執筆していただきました,吉留・古屋の両先生と柳川・七田の両先生に深く感謝いたします。

基本情報

生体の科学

出版社:株式会社医学書院

電子版ISSN 1883-5503

印刷版ISSN 0370-9531

雑誌購入ページに移動

バックナンバー

icon up
あなたは医療従事者ですか?