2108.07258 Aug 16, 2021 cs.AI

파운데이션 모델(Foundation Models)의 기회와 위험에 관하여

On the Opportunities and Risks of Foundation Models

Niladri S. Chatterji
Niladri S. Chatterji
Citations: 22,358
h-index: 22
Rishi Bommasani
Rishi Bommasani
Citations: 14,179
h-index: 12
Drew A. Hudson
Drew A. Hudson
Citations: 11,854
h-index: 12
Ehsan Adeli
Ehsan Adeli
Citations: 6,174
h-index: 8
R. Altman
R. Altman
Citations: 6,204
h-index: 5
Simran Arora
Simran Arora
Citations: 7,819
h-index: 22
Sydney von Arx
Sydney von Arx
Citations: 6,119
h-index: 4
Michael S. Bernstein
Michael S. Bernstein
Stanford University
Citations: 74,136
h-index: 66
Jeannette Bohg
Jeannette Bohg
Citations: 17,152
h-index: 50
Antoine Bosselut
Antoine Bosselut
EPFL
Citations: 13,412
h-index: 35
E. Brunskill
E. Brunskill
Citations: 16,504
h-index: 54
Erik Brynjolfsson
Erik Brynjolfsson
Citations: 45,224
h-index: 73
S. Buch
S. Buch
Citations: 10,141
h-index: 17
Dallas Card
Dallas Card
University of Michigan
Citations: 9,373
h-index: 24
Rodrigo Castellon
Rodrigo Castellon
Citations: 6,465
h-index: 5
Annie S. Chen
Annie S. Chen
Citations: 7,472
h-index: 11
Kathleen A. Creel
Kathleen A. Creel
Stanford University
Citations: 6,617
h-index: 12
Jared Davis
Jared Davis
Citations: 8,715
h-index: 15
Dora Demszky
Dora Demszky
Citations: 6,049
h-index: 3
Chris Donahue
Chris Donahue
Stanford
Citations: 8,600
h-index: 19
M. Doumbouya
M. Doumbouya
Citations: 6,039
h-index: 3
Esin Durmus
Esin Durmus
Stanford University
Citations: 14,059
h-index: 33
Stefano Ermon
Stefano Ermon
Citations: 77,253
h-index: 94
J. Etchemendy
J. Etchemendy
Citations: 8,877
h-index: 20
Kawin Ethayarajh
Kawin Ethayarajh
Citations: 9,152
h-index: 16
L. Fei-Fei
L. Fei-Fei
Citations: 6,875
h-index: 10
Chelsea Finn
Chelsea Finn
Citations: 78,161
h-index: 93
Trevor Gale
Trevor Gale
Citations: 8,030
h-index: 7
Lauren Gillespie
Lauren Gillespie
Citations: 6,012
h-index: 3
Karan Goel
Karan Goel
Citations: 11,742
h-index: 14
Noah D. Goodman
Noah D. Goodman
Citations: 26,802
h-index: 75
S. Grossman
S. Grossman
Citations: 6,143
h-index: 7
Neel Guha
Neel Guha
Citations: 9,410
h-index: 19
Tatsunori Hashimoto
Tatsunori Hashimoto
Citations: 18,086
h-index: 29
Peter Henderson
Peter Henderson
Citations: 11,884
h-index: 17
John Hewitt
John Hewitt
Stanford University
Citations: 12,060
h-index: 17
Daniel E. Ho
Daniel E. Ho
Citations: 6,920
h-index: 9
Jenny Hong
Jenny Hong
Citations: 6,042
h-index: 5
Kyle Hsu
Kyle Hsu
Citations: 6,618
h-index: 9
Jing Huang
Jing Huang
Citations: 7,444
h-index: 15
Thomas F. Icard
Thomas F. Icard
Citations: 9,647
h-index: 21
Saahil Jain
Saahil Jain
Citations: 6,364
h-index: 4
Dan Jurafsky
Dan Jurafsky
Stanford University
Citations: 64,839
h-index: 109
Pratyusha Kalluri
Pratyusha Kalluri
Citations: 8,054
h-index: 10
Siddharth Karamcheti
Siddharth Karamcheti
Stanford University
Citations: 10,285
h-index: 21
G. Keeling
G. Keeling
Citations: 6,205
h-index: 9
Fereshte Khani
Fereshte Khani
Stanford University
Citations: 6,424
h-index: 10
O. Khattab
O. Khattab
Citations: 12,378
h-index: 20
Pang Wei Koh
Pang Wei Koh
Stanford University
Citations: 20,606
h-index: 29
M. Krass
M. Krass
Citations: 6,200
h-index: 5
Ranjay Krishna
Ranjay Krishna
University of Washington
Citations: 22,203
h-index: 36
Rohith Kuditipudi
Rohith Kuditipudi
Citations: 6,526
h-index: 9
Ananya Kumar
Ananya Kumar
Citations: 10,398
h-index: 20
Faisal Ladhak
Faisal Ladhak
Citations: 11,317
h-index: 20
Mina Lee
Mina Lee
Stanford University
Citations: 7,220
h-index: 8
Tony Lee
Tony Lee
Stanford University
Citations: 7,865
h-index: 8
J. Leskovec
J. Leskovec
Citations: 165,043
h-index: 149
Isabelle Levent
Isabelle Levent
Citations: 5,994
h-index: 2
Xiang Lisa Li
Xiang Lisa Li
Stanford University
Citations: 14,252
h-index: 13
Xuechen Li
Xuechen Li
Stanford University
Citations: 12,116
h-index: 19
Tengyu Ma
Tengyu Ma
Citations: 11,752
h-index: 29
Ali Malik
Ali Malik
Citations: 6,206
h-index: 9
Christopher D. Manning
Christopher D. Manning
Stanford University
Citations: 192,084
h-index: 147
Suvir Mirchandani
Suvir Mirchandani
Stanford
Citations: 7,476
h-index: 12
E. Mitchell
E. Mitchell
Citations: 17,640
h-index: 22
Zanele Munyikwa
Zanele Munyikwa
Citations: 6,010
h-index: 2
Suraj Nair
Suraj Nair
Stanford University
Citations: 9,252
h-index: 20
A. Narayan
A. Narayan
Citations: 6,910
h-index: 11
D. Narayanan
D. Narayanan
Citations: 14,983
h-index: 21
Benjamin Newman
Benjamin Newman
University of Washington
Citations: 7,603
h-index: 9
Allen Nie
Allen Nie
Stanford University
Citations: 6,609
h-index: 11
Juan Carlos Niebles
Juan Carlos Niebles
Salesforce
Citations: 24,927
h-index: 64
H. Nilforoshan
H. Nilforoshan
Citations: 6,474
h-index: 8
Julian Nyarko
Julian Nyarko
Citations: 6,345
h-index: 3
Giray Ogut
Giray Ogut
Citations: 5,986
h-index: 2
Laurel J. Orr
Laurel J. Orr
Citations: 8,259
h-index: 12
Isabel Papadimitriou
Isabel Papadimitriou
Citations: 6,019
h-index: 3
J. Park
J. Park
Citations: 10,831
h-index: 16
C. Piech
C. Piech
Citations: 11,654
h-index: 27
Eva Portelance
Eva Portelance
Citations: 6,039
h-index: 5
Christopher Potts
Christopher Potts
Citations: 37,808
h-index: 58
Aditi Raghunathan
Aditi Raghunathan
Citations: 14,330
h-index: 25
Robert Reich
Robert Reich
Citations: 6,008
h-index: 3
Hongyu Ren
Hongyu Ren
Citations: 14,916
h-index: 26
Frieda Rong
Frieda Rong
Citations: 10,273
h-index: 8
Yusuf H. Roohani
Yusuf H. Roohani
Citations: 7,656
h-index: 16
Camilo Ruiz
Camilo Ruiz
Citations: 6,898
h-index: 5
Jack Ryan
Jack Ryan
Stanford University
Citations: 6,073
h-index: 2
Christopher R'e
Christopher R'e
Citations: 17,338
h-index: 21
Dorsa Sadigh
Dorsa Sadigh
Citations: 25,942
h-index: 66
Shiori Sagawa
Shiori Sagawa
Citations: 12,403
h-index: 16
Keshav Santhanam
Keshav Santhanam
Citations: 9,951
h-index: 15
Andy Shih
Andy Shih
Citations: 7,020
h-index: 18
K. Srinivasan
K. Srinivasan
Citations: 9,133
h-index: 16
Alex Tamkin
Alex Tamkin
Stanford University
Citations: 8,541
h-index: 25
Rohan Taori
Rohan Taori
Stanford
Citations: 8,744
h-index: 16
A. Thomas
A. Thomas
Citations: 6,859
h-index: 13
Florian Tramèr
Florian Tramèr
ETH Zürich
Citations: 34,885
h-index: 52
Rose E. Wang
Rose E. Wang
Citations: 6,387
h-index: 7
William Wang
William Wang
Citations: 7,437
h-index: 5
Bohan Wu
Bohan Wu
Citations: 6,331
h-index: 10
Jiajun Wu
Jiajun Wu
Stanford University
Citations: 32,146
h-index: 77
Yuhuai Wu
Yuhuai Wu
Citations: 20,197
h-index: 37
Sang Michael Xie
Sang Michael Xie
Citations: 12,611
h-index: 18
Michihiro Yasunaga
Michihiro Yasunaga
Citations: 21,832
h-index: 40
Jiaxuan You
Jiaxuan You
Citations: 14,829
h-index: 23
M. Zaharia
M. Zaharia
Citations: 69,637
h-index: 76
Michael Zhang
Michael Zhang
Citations: 6,376
h-index: 6
Tianyi Zhang
Tianyi Zhang
Citations: 20,265
h-index: 12
Xikun Zhang
Xikun Zhang
Stanford University
Citations: 7,653
h-index: 9
Yuhui Zhang
Yuhui Zhang
Stanford University
Citations: 11,624
h-index: 19
Lucia Zheng
Lucia Zheng
Citations: 8,003
h-index: 7
Kaitlyn Zhou
Kaitlyn Zhou
Citations: 6,752
h-index: 13
Percy Liang
Percy Liang
Citations: 80,335
h-index: 102

광범위한 데이터를 대규모로 학습하여 다양한 다운스트림 작업에 적응할 수 있는 모델들(예: BERT, DALL-E, GPT-3)의 부상으로 인해 AI는 패러다임의 전환을 겪고 있다. 우리는 이러한 모델들의 중요하고 중심적이지만 미완성인 특성을 강조하기 위해 이를 '파운데이션 모델(foundation models)'이라 부른다. 본 보고서는 파운데이션 모델의 능력(예: 언어, 시각, 로봇공학, 추론, 인간 상호작용) 및 기술적 원리(예: 모델 아키텍처, 훈련 절차, 데이터, 시스템, 보안, 평가, 이론)에서부터 응용 분야(예: 법률, 의료, 교육) 및 사회적 영향(예: 불평등, 오용, 경제 및 환경적 영향, 법적 및 윤리적 고려사항)에 이르기까지, 파운데이션 모델의 기회와 위험에 대한 포괄적인 설명을 제공한다. 파운데이션 모델은 표준 딥러닝과 전이 학습에 기반을 두고 있지만, 그 규모로 인해 새로운 창발적 능력이 나타나며, 수많은 작업에 걸친 효율성은 획일화를 촉진한다. 획일화는 강력한 이점을 제공하지만, 파운데이션 모델의 결함이 모든 다운스트림 적응 모델에 상속되기 때문에 주의가 요구된다. 파운데이션 모델의 광범위한 배포가 임박했음에도 불구하고, 우리는 현재 그 창발적 특성으로 인해 이 모델들이 어떻게 작동하는지, 언제 실패하는지, 심지어 무엇을 할 수 있는지에 대한 명확한 이해가 부족한 상태다. 이러한 문제들을 해결하기 위해, 우리는 파운데이션 모델에 대한 중요한 연구의 상당 부분이 그 근본적인 사회기술적 본질에 상응하는 깊이 있는 학제 간 협력을 필요로 할 것이라 믿는다.

Original Abstract

AI is undergoing a paradigm shift with the rise of models (e.g., BERT, DALL-E, GPT-3) that are trained on broad data at scale and are adaptable to a wide range of downstream tasks. We call these models foundation models to underscore their critically central yet incomplete character. This report provides a thorough account of the opportunities and risks of foundation models, ranging from their capabilities (e.g., language, vision, robotics, reasoning, human interaction) and technical principles(e.g., model architectures, training procedures, data, systems, security, evaluation, theory) to their applications (e.g., law, healthcare, education) and societal impact (e.g., inequity, misuse, economic and environmental impact, legal and ethical considerations). Though foundation models are based on standard deep learning and transfer learning, their scale results in new emergent capabilities,and their effectiveness across so many tasks incentivizes homogenization. Homogenization provides powerful leverage but demands caution, as the defects of the foundation model are inherited by all the adapted models downstream. Despite the impending widespread deployment of foundation models, we currently lack a clear understanding of how they work, when they fail, and what they are even capable of due to their emergent properties. To tackle these questions, we believe much of the critical research on foundation models will require deep interdisciplinary collaboration commensurate with their fundamentally sociotechnical nature.

6025 Citations
265 Influential
30 Altmetric
6,705.0 Score

AI Analysis

Korean Summary

스탠포드 대학의 CRFM(Center for Research on Foundation Models)에서 발표한 이 보고서는 '파운데이션 모델(Foundation Models)'이라는 새로운 AI 패러다임을 정의하고 심층 분석합니다. 파운데이션 모델은 방대한 데이터로(주로 자기 지도 학습을 통해) 학습되어 다양한 다운스트림 작업에 적응할 수 있는 모델(예: BERT, GPT-3, CLIP)을 지칭합니다. 이 보고서는 모델의 기술적 원리(모델링, 학습, 시스템 등)부터 언어, 비전, 로보틱스 등의 능력, 그리고 의료, 법률 등의 응용 분야를 포괄합니다. 특히 모델의 규모 확장이 가져오는 '창발성(Emergence)'과 단일 모델이 여러 애플리케이션의 기반이 되는 '동질화(Homogenization)' 특성을 중심으로, 기술적 기회와 함께 편향성, 오용, 환경 문제, 법적/윤리적 위험과 같은 사회적 영향을 종합적으로 다룹니다.

Key Innovations

  • 광범위한 데이터에 대한 대규모 자기 지도 학습(Self-supervised learning)과 전이 학습(Transfer learning)의 결합
  • 트랜스포머(Transformer) 아키텍처와 하드웨어 발전을 통한 모델 규모의 급격한 확장(Scale)
  • 별도의 명시적 학습 없이 프롬프트만으로 새로운 작업을 수행하는 인컨텍스트 러닝(In-context learning)과 같은 창발적 능력
  • 단일 모델을 다양한 다운스트림 태스크에 적용하는 적응(Adaptation) 기술(예: 파인튜닝, 프롬프팅)
  • 텍스트, 이미지, 로보틱스 센서 데이터 등을 통합하는 멀티모달(Multimodal) 학습 능력

Learning & Inference Impact

학습 과정에서는 방대한 데이터셋 구축과 막대한 컴퓨팅 자원이 요구되는 '사전 학습(Pre-training)' 단계가 핵심이 되며, 이는 하드웨어와 소프트웨어의 공동 설계(Co-design) 및 분산 학습 시스템의 중요성을 높입니다. 추론 및 응용 단계에서는 처음부터 모델을 학습시키는 대신, 사전 학습된 파운데이션 모델을 특정 태스크에 맞게 '적응(Adaptation)'시키는 방식으로 워크플로우가 변화했습니다. 이는 소량의 데이터로도 높은 성능을 낼 수 있게(Sample efficiency) 해주지만, 파운데이션 모델의 결함이나 편향이 모든 다운스트림 애플리케이션에 전파될 수 있는 단일 실패 지점(Single point of failure) 문제를 야기하기도 합니다.

Technical Difficulty

고급

Estimated implementation complexity based on methodology.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!