게시물 검색

ICT/정보통신 반도체 기술 혁신이 AI를 비약적으로 진화시킨다?

  • 관리자 (irsglobal1)
  • 2024-05-14 11:50:00
  • hit1954
  • 220.121.20.193

출처 : https://www.tel.co.jp/museum/magazine/report/202401_02/

 

202211월쯤부터 주목받기 시작한 ChatGPT(Generative Pretrained Transformer). 질문을 텍스트로 입력하면 답변을 해줄 뿐 아니라 새로운 텍스트나 사진을 만드는 완전히 새로운 AI(인공지능) 기술로서, 생성형(Generative) AI라 불린다.

여기에서 수천 개 이상 대량으로 사용되는 반도체 칩은 GPU(Graphic Processor Unit)이다. GPU를 개발해 온 미국의 Nvidia2023년에 세계 최고의 반도체 기업으로 비약할 것으로 예상되었다. 게다가 AI 기술은 생성형 AI뿐 아니라 컴퓨터나 스마트폰, 또는 IoT와 같은 엣지 단말기로까지 확장되고 있다.

 

여기서는 앞으로 펼쳐질 AI 기술을 뒷받침하는 반도체 기술을 소개한다.

 

AI IT 서비스 기술이 발전하려면~

 

AI IT 서비스의 중심이 되는 기술은 하드웨어와 소프트웨어 모두 핵심을 이루고 있다. 하드웨어가 없으면 소프트웨어는 사용할 수 없다. 또한 소프트웨어가 없으면 하드웨어는 그냥 상자에 불과하다. 둘이 서로 발전되어야 진보할 수 있다. 그런데 여기서 말하는 하드웨어는 이제는 반도체 칩 자체를 가리키는 말이 되었다. 시스템이 반도체 IC칩에 탑재되고, ICSoC(System on Chip)라 불리게 되었기 때문이다.

 

생성형 AI가 등장하게 된 배경에도 사실 하드웨어와 소프트웨어 모두의 발전이 있다. 생성형 AI는 어떤 질문에도 답변해주며, 작곡이나 논문, 소설, 그림 등도 생성한다. 즉 정치, 경제, 금융, 문학, 법학, 음악, 회화, 물리학, 화학, 생물학, 문화, 풍습, 여행, 전자공학 및 반도체 공학, 기계공학 등 다양한 분야의 지식이 집결되어 있다. 이러한 모든 것을 학습시켰기 때문에, 그 소프트웨어는 아주 방대해진다. ChatGPTGPT-3이라 불리는 기술은 대규모 언어 모델(LLM)로 구성되며, 학습시키는 데 수천 개의 GPU를 사용하고 300일이 걸린다고 한다.

 

또한 방대한 텍스트를 가지고 요구되는 답변을 도출하기 위해 트랜스포머라 불리는 기술을 사용하여 텍스트 중에서 주목해야 하는 단어(어텐션)를 인식하고, 단어와 단어의 관계성과 문맥을 이해하여, 다음으로 이어질 내용을 추측한다. 이 기술을 통해 질문의 답변을 만들어 낸다.

 

반도체 기업의 노력이 생성형 AI를 실현시킴

 

지금까지 많은 소프트웨어 기술자가 생성형 AI에게 학습시키는 방대한 작업량에 압도되어 실용적이지 않다고 포기했었다.

그래서 반도체 기업은 AI칩의 성능을 높이기 위해 노력했다. 예를 들어 학습하는 데 300일이 걸리는 방대한 소프트웨어에서 AI칩의 성능을 10배로 높이면 30일 만에 학습할 수 있다. 100배로 높이면 3일이면 된다. 반도체 설계자에게는 매우 도전적인 일이지만, 보람이 있는 주제라 할 수 있다. Nvidia의 동기부여는 여기에 있다(그림1).

 

<그림1> Nvidia가 개발한 최신 AI‘Grace Hopper’

GPUCPU의 강점을 합친 AI 칩을 통해 진화하고 있다.

 

반대로 AI 전용 칩의 성능이 향상되면서 소프트웨어 기술자도 생성형 AI에 도전하게 되었다. ChatGPU를 개발한 것은 OpenAI(미국)인데, OpenAI의 뒤를 이어 미국의 AnthropicInflection AI, 캐나다의 Cohere LLM을 사용하는 생성형 AI 모델을 개발하는 스타트업이 탄생하여, AI칩을 필요로 하게 되었다.

물론 생성형 AI를 제공하는 미국의 클라우드 서비스 사업자 AWS(Amazon Web Service)Google Cloud, Microsoft 등도 AI 칩을 요구하고 있다. 마치 생성형 AI에 모여드는 듯한 기세를 보인다.

 

AI란 무엇인가

 

AI라는 말은 많이 사용되고 있다. 예전에는 간단한 제어 회로나 연산 회로에서도 인공지능이라는 말이 가전제품의 광고 등에서 사용되었다. 지금도 AI와 컴퓨터의 차이를 혼동하는 경우를 흔히 볼 수 있다. 그래서 IBM(미국)은 몇 년 전까지만 해도 기계학습 기술을 도입해도 AI라고는 하지 않고, 최초의 AI 컴퓨터 ‘Watson’을 코그니티브 컴퓨터라 불렀다.

 

일반적으로는 기계학습이나 딥러닝을 수행하는 컴퓨터를 AI라 부른다. 한 가지 행동을 수행하기 위해 학습을 통해 지식을 축적하고, 그 지식 데이터를 가지고 새롭게 제시된 문제를 추론하여 출력한다. 그러므로 학습되어 있지 않은 컴퓨터 기술은 AI라 부르지 않는다. 이러한 학습과 추론이 함께하는 기술이 AI이다.

 

예를 들어, 화상 인식에서 사과나 토마토, , 오이 등을 판별할 수 있게 만들고자 각각 수천 장, 수만 장의 이미지 데이터를 입력하고, 그것이 무엇인지를 미리 학습시킨다.

 

학습시키는 데 사용되는 모델을 인간의 뇌의 신경 세포(뉴런)와 그 연결, 즉 신경 구조를 모방한 뉴럴 네트워크라고 부른다.

뉴런 1개의 모델로서, 다입력 1출력의 연산기를 사용한다(그림2). 그리고 모델을 둔화시키기 위해 출력 데이터를 0 또는 1로 둔다. 다입력이라고는 해도 5~8개의 신호가 오는 정도이다. 또한 입력 데이터는 그대로 사용하지 않고, 입력 데이터에 어떤 형태로든 중점을 두고 연산한다.

후에 기술하는 것처럼, 이러한 중점을 바꿈으로써 학습하게 된다. 다수의 입력 데이터를 합한 결과가 0 또는 1의 출력이 된다. 이를 수식으로 나타내면, A1×B1A2×B2+……An×Bn이 된다. 이것은 수학의 급수 전개의 수치 연산 또는 행렬 연산과 같다.

 

<그림2> 뉴럴 네트워크의 개념도

뉴럴 네트워크의 기본은 뉴런의 모델 퍼센트론이라 불린다.

 

이러한 뉴럴 네트워크 모델에서는 뉴런에 입력된 값의 중점을 바꾸는 것이 학습 강도와 연관된다. 추론에서도 마찬가지로 뉴럴 네트워크에서 나온 출력을 통합하여 학습 데이터와 비교하고, 예를 들면 사과인지 토마토인지 판단한다. AI에서 이루어지는 연산은 An×Bn의 곱한 것을 더한 값이기 때문에 곱합연산이라 불린다.

 

사실 AI칩으로 주목받고 있는 GPU에는 작은 곱합연산기가 많이 집적되어 있다. 이것이 뉴럴 네트워크의 연산 그 자체이다. 게임기용 GPU를 개발해 온 NvidiaAI에서도 GPU를 사용한 것은 이 때문이다.

 

생성형 AI에서는 자연언어를 이해할 수 있게 하기 위해 수조 개에 이르는 단어를 학습시킨다. ChatGPT로 대표되는 GPT-3에서는 1750억 파라미터라는 거대한 소프트웨어 모델 규모를 이루고 있으며, OpenAIGPT-41조 파라미터에 달한다고 한다.

 

하지만 업계 전체가 초대규모의 LLM을 개발하고 있지는 않다. 예를 들어 IBMGPT-3보다 한 자릿수 작은 100~200억 파라미터의 생성형 AI 모델을 개발하고 있다.

 

각사의 생성형 AI를 위한 칩 개발 속도 향상

 

생성형 AI를 위한 반도체 칩으로는 NvidiaGrace Hopper, 메모리를 대량으로 집적한 H100, 그 전의 A100 등이 있다. AI칩을 발전시켜 성능을 향상시키고, 학습 시간을 단축하기 위해 노력하고 있다.

 

Nvidia를 뒤쫓는 AMD(미국)20236월의 Computex Taipei에서 H100에 뒤지지 않는 칩 AMD MI300X의 샘플을 선보였고, 12월에 출시했다. 이것은 성능적으로는 Nvidia의 신제품 H100과 비슷하거나 10~20% 정도 성능을 향상시킨 제품이다.

 

지금까지 300mm 웨이퍼 규모의 AI‘WSE-2’를 설계해 온 Cerebras Systems(미국)202311월에 아랍에미리트(UAE)의 대형 지주회사 G42와 함께 4Exa FLOPSAI 컴퓨터를 개발한다. AI칩은 300mm 웨이퍼에서 사각형의 중심 부분을 떼어낸 형태의 웨이퍼 스케일 IC이다. 2.6조 개의 트랜지스터를 집적했다.

 

<그림3> 300mm 웨이퍼에서 떼어낸 하나의 거대한 AI(왼쪽). 오른쪽 아래의 작은 칩은 일반적으로 입수할 수 있는 최고 성능의 NvidiaA100

 

생성형 AI를 통해 업무 효율을 높이는 시대로

 

생성형 AI는 일반 기업의 사원이 더욱 가치 있는 활동에 집중할 수 있도록 일상 업무를 자동화하며, 더욱 창의적인 콘텐츠나 코드를 만들고 콘텐츠를 요약하며 검색하는 등 혁신적인 기능을 통해 사원을 지원할 수 있다고, IBM은 생각한다. 동사는 목적이나 고객 기업에 따라 최적의 생성형 AI 모델을 제안한다.

 

NECGhatGPT보다 가벼운 생성형 AI의 사용 방법을 모색하고 있으며, 자동차 사고가 일어났을 때 블랙박스에 저장되어 있는 영상을 통해 사고 보고서를 자동으로 작성하는 등의 응용 방법을 개발했다.

 

Nvidia는 생성형 AI를 응용하여 자사의 칩을 설계할 때 생성형 AI를 사용한다. 이 생성형 AI에서는 자사에서 개발한 대규모 언어 모델을 사용하여 칩 설계를 살펴보거나 버그 기록을 정리하거나 EDA 툴의 스크립트를 기록한다. LSI 설계의 생산성을 조금이라도 향상시키는 것을 목적으로 한다.

 

PC IoT 등 엣지까지 확장되는 AI 활용

 

한편 엣지 AI를 사용하는 기업도 증가하고 있다. 엣지 AI란 클라우드를 통하지 않고 손(엣지)에 있는 디바이스(컴퓨터나 스마트폰)에서 AI(기계학습) 처리를 하는 기술이다.

 

AMD는 컴퓨터용 모노리식 프로세서 SoC로서, AI 엣지에 탑재되는 AMD Ryzen Pro 7040 시리즈를 20239월에 발표했다. TSMC4nm 프로세스로 제조했으며, AI 전용 회로에서는 추론에 더해 학습도 가능하다.

 

202312월에는 Intel(미국)이 컴퓨터용 프로세서 Core Ultra(개발 코드명 Meteor Lake)를 정식으로 출시했다. 이 칩은 칩렛 및 3차원 IC 등 첨단 패키징 기술로 만들어졌으며, 특히 AI 전용 처리 회로를 집적했다. 이 칩에는 기존 서버 및 컴퓨터에 사용되었던 2.5D/3D-IC 및 칩렛 등 첨단 패키징 기술이 사용된다.

 

Qualcomm(미국)은 모바일 디바이스에도 AI 기능을 삽입하려 하고 있다. 이로 인해 AI를 언제 어디서든(유비쿼터스로) 사용할 수 있게 된다. 다만 성능을 우선하는 것이 아니라 소비 전력이 적은 AI를 지향하기 때문에, 클라우드와 모바일 각각의 장점을 끌어내는 하이브리드 방식을 사용한다. 예를 들어 고성능이 필요한 생성형 AI는 클라우드를 이용하고, 추가 학습량이 적을 때는 소비 전력이 적은 모바일에서 수행한다.

 

스마트폰에서 AI를 어떻게 사용할 수 있는지에 대해 Google이 일례를 제시하였다. 촬영한 사진은 확대해도 그보다 더 선명해지지 않지만, Google이 최근 발매한 스마트폰 ‘Pixel 8’AI를 사용하여 화소를 보완하여 그것이 가능하게 하였다. 또한 여러 사람의 얼굴을 찍는 경우 모든 사람이 웃고 있는 사진을 찍기는 어렵다.

하지만 AI가 웃는 사진을 선택하여 사진을 합성함으로써 모든 사람이 웃고 있는 사진을 합성할 수 있다. 순식간에 여러 장의 사진을 촬영하게 되는데, 어떤 얼굴이 웃는 모습인지를 사전에 학습한 AI가 판단한다.

 

, AI는 사소한 일에서도 사용되게 되었다. 대학 연구에서도 AI를 사용하는 사례가 종종 등장한다. 예를 들어, 까끌까끌함이나 사각사각한 느낌, 젖은 느낌 등의 촉감을 수치로 표현하는 방법을 연구하는 가가와 대학의 다카오 히데쿠니 교수는 기업의 서로 다른 물티슈 7종의 미묘한 촉감 차이를 두 종류의 센서를 통해 AI가 학습하게 한 결과, AI는 전부 구별해 냈지만 사람은 판별할 수 없었다고 한다.

 

비슷한 예로, STMicroelectronics(스위스)는 자사의 마이크로 컨트롤러 칩에 AI 전용 회로를 집적하여, AI 기능을 빨래 후에 이용할 수 있는 모델을 만들었다. 이것은 작동시키는 모터의 회전수를 빨랫감의 무게에 따라 최적의 전류 값으로 결정하는 것으로서, 빨랫감의 무게를 추정하는 데 기계학습을 이용했다. 이로 인해 빨래 후 소비 전력을 줄일 수 있다.

 

AI 칩이 가져올 미래

 

AI는 어떤 의미에서는 편리한 도구이다. IBM이 생각하는 것처럼 지루한 일상 업무를 생성형 AI에게 시키고, 사람은 좀 더 창의적인 일에 매진한다는 것은 이상적인 모습이라 할 수 있다. 하지만 AI는 컴퓨터 기계를 학습시키는 것이기 때문에 윤리에 반하는 일이나 인류의 적이 될 수 있는 일을 학습시켜서는 절대로 안 된다.

 

따라서 IBM은 의도치 않게 비윤리적인 일을 학습시키게 되는 일을 막기 위해 ‘watsonx.governance’라 불리는 툴 키트를 준비하고 있다. 이것은 투명하고 책임 있는 AI를 실현하기 위한 도구이며, 이 툴을 따라 AI의 워크플로우를 만들면 비윤리적인 모델을 배제할 수 있다.

 

이러한 윤리적인 AI 워크플로우를 만들어 내는 도구를 표준화하거나, 한국표준협회와 같은 공업 제품의 기준을 적용하는 등 공적인 이 되어줄 존재가 앞으로의 AI 개발에 필요하다.

 

 

[2024 반도체 Global Market Data : Current Status & Outlook] 상세 보기

https://www.irsglobal.com/shop_goods/goods_view.htm?category=02000000&goods_idx=94341&goods_bu_id=

 

[2024년 글로벌 인공지능 반도체 기술개발, 시장전망과 기업별 사업전략] 보고서 상세보기

https://www.irsglobal.com/shop_goods/goods_view.htm?category=02000000&goods_idx=95386&goods_bu_id=

게시글 공유 URL복사