AWS로 구현하는 생성형 AI LLM에서 멀티모달 모델까지, RAG, LoRA, RLHF를 활용한 AWS 기반 생성형 AI 구축 가이드 책소개
AWS로 구현하는 생성형 AI
AWS로 구현하는 생성형 AI에 관련된
책을 소개해드릴게요.
http://app.ac/P3PyfeJ63
업계와 학계에서 다루는 가장 일반적인 생성형 AI 활용 사례와 작업을 이해할 수 있습니다!
오늘날 기업은 자사의 제품과 서비스에 생성형 AI를 빠르게 도입하고 있습니다. 그러나 이 기술의 영향력과 잠재력에 대해 과장된 정보와 오해가 많이 존재합니다. AWS의 크리스 프레글리, 안체 바르트, 셸비 아이겐브로데는 이 책에서 CTO, 머신러닝 실무자, 애플리케이션 개발자, 비즈니스 분석가, 데이터 엔지니어, 데이터 사이언티스트가 이 흥미로운 신기술을 실용적으로 활용하는 방법을 찾도록 도와줍니다.
이 책을 통해 활용 사례 정의, 모델 선택, 모델 미세 조정, 검색 증강 생성, 인간 피드백을 통한 강화 학습, 모델 양자화, 최적화, 배포 등 생성형 AI 프로젝트의 생명 주기를 배울 수 있습니다. 또한 대규모 언어 모델(LLM), 이미지 생성을 위한 스테이블 디퓨전, 이미지 관련 질문에 답하는 Flamingo, IDEFICS 같은 멀티모달 모델 등 다양한 유형의 모델도 살펴봅니다.
★ 이 책에서 다루는 내용 ★
◎ 생성형 AI를 비즈니스 현장에 적용하는 방법
◎ 작업에 가장 적합한 생성형 AI 모델을 결정하는 방법
◎ 프롬프트 엔지니어링과 콘텍스트 내 학습을 수행하기
◎ 저순위 적응(LoRA)으로 데이터 세트에 맞게 생성형 AI 모델을 미세 조정하기
◎ 인간 피드백을 통한 강화 학습(RLHF)으로 생성형 AI 모델을 인간의 가치에 맞추는 방법
◎ 검색 증강 생성(RAG)으로 모델을 증강하기
◎ 랭체인, ReAct 같은 라이브러리를 활용해 에이전트와 액션을 개발하기
◎ 아마존 베드록으로 생성형 AI 애플리케이션을 만드는 방법
저자(글) 크리스 프레글리
인물정보
IT종사자
(Chris Fregly)
캘리포니아 샌프란시스코에 위치한 아마존 웹 서비스의 생성형 AI 부문 수석 솔루션 아키텍트입니다. 그는 모든 AWS 인증을 보유하고 있습니다. 글로벌 Generative AI on AWS 밋업의 공동 창립자이기도 하며, 전 세계 AI 및 머신러닝 밋업과 콘퍼런스에서 정기적으로 강연합니다. 이전에는 Databricks와 Netflix에서 엔지니어로 일하며, 확장성 있는 빅데이터 및 머신러닝 제품과 솔루션을 개발했습니다. 또한 《AWS 기반 데이터 과학》(한빛미디어, 2023)의 공동 저자이기도 합니다.
저자(글) 안체 바르트
(Antje Barth)
캘리포니아 샌프란시스코에 위치한 아마존 웹 서비스의 생성형 AI 부문 수석 개발자 애드보킷입니다. 그녀는 글로벌 Generative AI on AWS 밋업과 뒤셀도르프 Women in Big Data 지부의 공동 창립자입니다. 안체는 전 세계 AI 및 머신러닝 콘퍼런스와 밋업에서 자주 강연합니다. AWS에 합류하기 전에는 MapR과 Cisco에서 솔루션 엔지니어로 일하며, 개발자가 AI와 머신러닝 분야에서 빅데이터, 컨테이너, 쿠버네티스 플랫폼을 활용할 수 있도록 도왔습니다. 그녀 역시 《AWS 기반 데이터 과학》의 공동 저자입니다.
저자(글) 셸비 아이겐브로데
(Shelbee Eigenbrode)
콜로라도 덴버에 위치한 아마존 웹 서비스의 생성형 AI 부문 수석 솔루션 아키텍트입니다. 그녀는 덴버 Women in Big Data 지부의 공동 창립자입니다. 셸비는 6개의 AWS 인증을 보유하고 있으며, 23년 동안 여러 산업과 기술, 역할을 망라하는 기술 분야에서 일해 왔습니다. 그녀는 DevOps와 머신러닝 분야의 전문 지식을 활용해 대규모 머신러닝 작업 구현에 주력하고 있습니다. 다양한 기술 영역에서 35개 이상의 특허를 출원한 셸비는 지속적인 혁신과 데이터를 활용한 비즈니스 성과 창출에 열정을 가지고 있습니다.
번역 이승필
삼성SDS 협업솔루션 개발 관리자로서, 20여 년간 다양한 SI 프로젝트와 솔루션 개발 프로젝트에서 아키텍트, 프로그램 매니저로 활동 중이다. 현재 사내 생성형 AI 솔루션 개발을 리딩하고 있다.
번역 한우선
삼성SDS 수석 엔지니어로, 다양한 프로젝트와 솔루션 구축 업무를 수행했다. 현재 생성형 AI 솔루션 개발을 리딩하고 있으며, AI를 활용한 고객 경험 향상에 앞장서고 있다. 《엘라스틱서치를 활용한 벡터 검색 실무 가이드》(위키북스, 2024)를 번역했다.
번역 유태황
삼성SDS에서 소프트웨어 아키텍트 및 프로그래머로 일하고 있다. 스프링 부트, 카프카, 엘라스틱서치 등 다양한 백엔드 기술 스택 및 효율적인 아키텍처에 관심이 많다. 《엘라스틱서치를 활용한 벡터 검색 실무 가이드》를 번역했다.
번역 박주경
삼성SDS 소프트웨어 아키텍트로, 다양한 기술과 아키텍처를 활용해 솔루션 품질을 향상하는 데에 관심이 있다. AWS SAA 자격을 보유하고 있으며, AWS를 활용한 여러 프로젝트를 수행했다.
번역 정유석
삼성SDS에서 소프트웨어 개발자로 근무 중이다. NLP와 NLG 관련 일을 시작으로 현재는 AWS 기반의 프롬프트 엔지니어링 업무를 수행하며, 파인 튜닝, 모델 평가 등 생성형 AI 관련 기술에 관심이 많다.
목차
▣ 01장: 생성형 AI 활용 사례, 기본 사항 및 프로젝트 생명 주기
활용 사례 및 작업
파운데이션 모델 및 모델 허브
생성형 AI 프로젝트의 생명 주기
AWS에서의 생성형 AI
AWS에서 생성형 AI를 사용하는 이유
AWS에서 생성형 AI 애플리케이션 구축하기
요약
▣ 02장: 프롬프트 엔지니어링과 콘텍스트 내 학습
프롬프트와 컴플리션
토큰
프롬프트 엔지니어링
프롬프트 구조
___인스트럭션
___콘텍스트
퓨샷 추론으로 콘텍스트 내 학습
___제로샷 추론
___원샷 추론
___퓨샷 추론
___콘텍스트 내 학습이 잘못된 사례
___콘텍스트 내 학습 모범 사례
프롬프트 엔지니어링 모범 사례
추론 구성 매개변수
요약
▣ 03장: 대형 언어 파운데이션 모델
대형 언어 파운데이션 모델
토크나이저
임베딩 벡터
트랜스포머 아키텍처
___입력과 콘텍스트 윈도
___임베딩 레이어
___인코더
___셀프 어텐션
___디코더
___소프트맥스 출력
트랜스포머 기반 파운데이션 모델 유형
사전 학습 데이터 세트
스케일링 법칙
컴퓨팅 최적화 모델
요약
▣ 04장: 메모리와 연산 최적화
메모리 문제
데이터 유형 및 수치 정밀도
양자화
___fp16
___bfloat16
___fp8
___int8
셀프 어텐션 레이어 최적화
___플래시 어텐션
___그룹 쿼리 어텐션
분산 컴퓨팅
___분산 데이터 병렬 처리
___완전 샤드 데이터 병렬 처리
___DDP와 FSDP의 성능 비교
AWS 분산 컴퓨팅
___아마존 세이지메이커로 완전 샤드 데이터 병렬 처리
___AWS 뉴런 SDK 및 AWS 트레이니엄
요약
▣ 05장: 미세 조정 및 평가
인스트럭션 기반 미세 조정
___Llama 2-Chat
___Falcon-Chat
___FLAN-T5
인스트럭션 데이터 세트
___다중작업 인스트럭션 데이터 세트
___FLAN: 다중작업 인스트럭션 데이터 세트 예제
___프롬프트 템플릿
___사용자 정의 데이터 세트를 인스트럭션 데이터 세트로 변환하기
인스트럭션 기반 미세 조정
___아마존 세이지메이커 스튜디오
___아마존 세이지메이커 점프스타트
___허깅 페이스용 아마존 세이지메이커 Estimator
평가
___평가 지표
___벤치마크 및 데이터 세트
요약
▣ 06장: 효율적인 매개변수 미세 조정(PEFT)
완전 미세 조정과 PEFT 비교
LoRA와 QLoRA
___LoRA 기본 원리
___순위
___목표 모듈과 레이어
___LoRA 적용
___LoRA 어댑터와 원본 모델 병합
___LoRA 어댑터 테넌트별 유지
___완전 미세 조정과 LoRA 성능 비교
___QLoRA
프롬프트 튜닝과 소프트 프롬프트
요약
▣ 07장: 인간 피드백을 통한 강화 학습으로 미세 조정
인간 가치 정렬(Human Alignment): 유용성, 정직성, 무해성
강화 학습 개요
맞춤형 보상 모델 학습하기
___휴먼인더루프를 활용한 학습 데이터 수집
___레이블러를 위한 지침 예시
___인간이 단 주석을 수집하기 위한 아마존 세이지메이커 그라운드 트루스 활용하기
___보상 모델을 학습하기 위한 순위 데이터 준비
___보상 모델 학습하기
기존 보상 모델: 메타의 유해성 판독기
인간 피드백을 통한 강화 학습으로 미세 조정
___RLHF에서 보상 모델 활용
___근접 정책 최적화 강화 학습 알고리즘
___PPO로 RLHF 미세 조정 수행
___보상 해킹 완화
___RLHF에서 효율적인 매개변수 미세 조정(PEFT) 활용
RLHF로 미세 조정 모델 평가
___정성적 평가
___정량적 평가
___평가 모델 가져오기
___평가 지표 집계 함수 정의
___RLHF 적용 전과 후 평가 지표 비교
요약
▣ 08장: 모델 배포 최적화
모델 추론 최적화
___가지치기
___GPTQ 사후 학습 양자화
___증류
대규모 모델 추론 컨테이너
AWS 인퍼런시아: 추론 전용 하드웨어
모델 업데이트와 배포 전략
___A/B 테스트
___섀도 배포
지표와 모니터링
오토스케일링
___오토스케일링 정책
___오토스케일링 정책 정의
요약
▣ 09장: RAG와 에이전트를 활용한 맥락 인식 추론 애플리케이션
대규모 언어 모델의 한계
___환각
___지식 단절
RAG
___외부 지식 소스
___RAG 워크플로
___문서 로딩
___청킹
___문서 검색과 순위 재정렬
___프롬프트 증강
RAG 오케스트레이션과 구현
___문서 로딩과 청킹
___벡터 임베딩 저장소와 검색
___검색 체인
___최대 한계 관련성(MMR)을 활용한 순위 재정렬
에이전트
___ReAct 프레임워크
___프로그램 지원 언어 프레임워크
생성형 AI 애플리케이션
FMOps: 생성형 AI 프로젝트의 생명 주기 운영
___실험 단계 고려 사항
___개발 단계 고려 사항
___운영 배포 단계 고려 사항
요약
▣ 10장: 멀티모달 파운데이션 모델
활용 사례
멀티모달 프롬프트 엔지니어링 활용 예시
이미지 생성과 품질 향상
___이미지 생성
___이미지 편집 및 품질 향상
인페인팅, 아웃페인팅, 뎁스 투 이미지
___인페인팅
___아웃페인팅
___뎁스 투 이미지
이미지 캡셔닝과 시각적 질의응답
___이미지 캡셔닝
___콘텐츠 조정
___시각적 질의응답
모델 평가
___텍스트-이미지 생성형 작업
___이미지-텍스트 생성형 작업
___비언어적 추론
확산 아키텍처 기본 사항
___순방향 확산
___역방향 확산
___U-Net
스테이블 디퓨전 2 아키텍처
___텍스트 인코더
___U-Net과 확산 과정
___텍스트 컨디셔닝
___교차 어텐션
___스케줄러
___이미지 디코더
스테이블 디퓨전 XL 아키텍처
___U-Net과 교차 어텐션
___정제기
___컨디셔닝
요약
▣ 11장: 스테이블 디퓨전을 통한 생성 제어와 미세 조정
ControlNet
미세 조정
___드림부스
___드림부스와 PEFT-LoRA
___Textual Inversion
인간 피드백을 통한 강화 학습으로 인간 가치 정렬
요약
▣ 12장: 아마존 베드록 - 생성형 AI 관리형 서비스
베드록 파운데이션 모델
___아마존 타이탄 파운데이션 모델
___Stability AI의 스테이블 디퓨전 파운데이션 모델
베드록 추론 API
대규모 언어 모델
___SQL 코드 생성
___텍스트 요약
___임베딩
미세 조정
에이전트
멀티모달 모델
___텍스트로 이미지 생성
___이미지로 이미지 생성
데이터 프라이버시와 네트워크 보안
거버넌스와 모니터링
요약
그럼 이상으로 AWS로 구현하는 생성형 AI LLM에서 멀티모달 모델까지, RAG, LoRA, RLHF를 활용한 AWS 기반 생성형 AI 구축 가이드 책 포스팅을 마치겠습니다.
AWS로 구현하는 생성형 AI LLM에서 멀티모달 모델까지, RAG, LoRA, RLHF를 활용한 AWS 기반 생성형 AI 구축 가이드 책 포스팅은 제휴마케팅이 포함되어있습니다.
#AWS, #AI, #LLM, #책, #강의, #강좌