허깅페이스

딥러닝 프로젝트를 위한 허깅페이스 관련 

책을 소개해드릴게요.

http://app.ac/lACOQj593

 

딥러닝 프로젝트를 위한 허깅페이스 실전 가이드 | 윤대희 - 교보문고

딥러닝 프로젝트를 위한 허깅페이스 실전 가이드 | 허깅페이스를 활용한 최신 인공지능 기술의 핵심 개념과 실무 능력을 제공합니다!허깅페이스는 현대 딥러닝 분야, 특히 자연어 처리와 컴퓨

product.kyobobook.co.kr

허깅페이스를 활용한 최신 인공지능 기술의 핵심 개념과 실무 능력을 제공합니다!

허깅페이스는 현대 딥러닝 분야, 특히 자연어 처리와 컴퓨터 비전 영역에서 널리 사용되는 강력한 도구입니다. 이 책은 허깅페이스를 활용하여 다양한 딥러닝 프로젝트를 구축하는 방법을 상세히 다룹니다. 트랜스포머 모델의 기본 개념부터 시작하여 자연어 처리, 컴퓨터비전, 멀티모달까지 폭넓은 주제를 다루며, 실제 프로젝트 구현을 통해 실용적인 지식을 제공합니다.

이 책은 허깅페이스를 활용해 모델 설정, 토크나이저 사용, 데이터세트 처리, 모델 학습 및 평가 등 프로젝트 전 과정을 상세히 다룹니다. 또한 최신 모델인 BERT, BART, RoBERTa, T5, LLaMA-3.1 등을 활용한 다양한 자연어 처리 모델과 CLIP, OWLv2, SAM 등을 이용한 컴퓨터 비전 모델, 그리고 BLIP-2, LayoutLM, ViLT, Stable-diffusion 등의 멀티모달 모델을 실습합니다.

허깅페이스를 이용해 최신 딥러닝 기술을 실제 프로젝트에 적용하고자 하는 개발자, 연구자, 그리고 데이터 사이언티스트 모두에게 강력하게 이 책을 추천합니다!

★ 이 책에서 다루는 내용 ★

◎ 허깅페이스 이해 및 활용 방법

◎ 트랜스포머 모델의 구조와 작동 원리 이해

◎ 허깅페이스 허브와 리포지터리를 활용한 모델 공유 및 관리

◎ 허깅페이스 트랜스포머 라이브러리를 이용한 모델 설정, 학습, 평가

◎ 자연어 처리 프로젝트(텍스트 분류, 요약, 질의 응답, 기계 번역, 텍스트 생성) 실습

◎ 컴퓨터비전 프로젝트(이미지 분류, 객체 검출, 이미지 세그먼테이션) 실습

◎ 멀티모달 프로젝트(이미지 캡셔닝, 문서 질의 응답, 시각적 질의 응답, 이미지 생성) 실습

◎ 고급 기능(이미지 매칭, 하이퍼파라미터 최적화, 모델 양자화, 분산 학습) 실습

작가정보

저자(글) 윤대희

카카오스타일의 데이터사이언스 팀 리더로 현재 데이터 리터러시, 데이터 패브릭, MLOps 프로젝트를 진행하고 있다. 이전에는 어반베이스의 머신러닝 팀 리더를 맡아 컴퓨터비전과 딥러닝을 활용해 2D 도면을 3D로 변환하는 프로젝트를 수행했다. 머신러닝·딥러닝을 비롯해 데이터 품질 관리, 데이터 통합, 비즈니스 인텔리전스 등 데이터 통합에 관심이 있으며, 기술 공유 및 확장 플러그인 배포 등으로 개인이나 조직이 기술을 보다 쉽게 이용하고 활용할 수 있도록 도움을 주고 있다.

저자(글) 김동화

고려대학교에서 산업경영공학 박사 학위를 취득했다. 데이터 기반으로 제조, IT, 금융 분야에서 발생하는 다양한 기술적 문제를 해결했으며, 머신러닝·딥러닝 분야에 총 6편의 SCI 논문을 게재했다. 카카오스타일에서 컴퓨터비전과 딥러닝을 담당했으며 패션 속성 추출, 유사 이미지 추천 및 코디 추천을 수행했다. 현재는 우아한형제들에서 다양한 푸드/이커머스 플랫폼 과제를 진행하고 있다. 컴퓨터비전, 자연어 처리, 멀티모달 학습을 연구하고 활용하는 데 관심이 있다.

목차

▣ 01장: 허깅페이스 알아보기

1.1 인공지능과 허깅페이스

___1.1.1 머신러닝과 딥러닝

___1.1.2 딥러닝을 위한 허깅페이스

1.2 트랜스포머

___1.2.1 트랜스포머 모델 구조

___1.2.2 멀티 헤드 어텐션

___1.2.3 마스크드 멀티 헤드 어텐션

1.3 파이토치 설치 및 환경 설정

___1.3.1 윈도우 / 리눅스

___1.3.2 리눅스(ROCm)

___1.3.3 맥

___1.3.4 구글 코랩

1.4 허깅페이스 허브

___1.4.1 허깅페이스 알아보기

___1.4.2 Models 페이지 알아보기

___1.4.3 사전 학습된 모델 다운로드

1.5 허깅페이스 리포지터리

___1.5.1 모델 리포지터리 생성

___1.5.2 모델 파일 업로드

___1.5.3 push_to_hub 메서드를 통한 업로드

___1.5.4 Git을 통한 업로드

▣ 02장: 허깅페이스 트랜스포머

2.1 라이브러리 소개

___2.1.1 트랜스포머

___2.1.2 토크나이저

___2.1.3 데이터세트

___2.1.4 디퓨저

___2.1.5 가속화

2.2 모델 설정

___2.2.1 PretrainedConfig 클래스

___2.2.2 ModelConfig 클래스

2.3 토크나이저

___2.3.1 PreTrainedTokenizer 클래스

___2.3.2 ModelTokenizer 클래스

2.4 모델

___2.4.1 PreTrainedModel 클래스

___2.4.2 ModelModel 클래스

2.5 특징 추출

___2.5.1 ImageFeatureExtractor 클래스

___2.5.2 AudioFeatureExtractor 클래스

2.6 이미지 프로세서

___2.6.1 ImageProcessor 클래스

2.7 오토 클래스

___2.7.1 주요 Auto 클래스

2.8 파이프라인

___2.8.1 파이프라인 종류와 예시

___2.8.2 pipeline 함수

2.9 데이터세트

___2.9.1 선택, 분리, 병합

___2.9.2 필터 및 맵

___2.9.3 기타 메서드

___2.9.4 데이터 업로드

2.10 트레이너

___2.10.1 트레이너 클래스

___2.10.2 트레이닝 아규먼트

___2.10.3 토큰 분류 - 개체명 인식

2.11 모델 평가

___2.11.1 평가 라이브러리

▣ 03장: 자연어 처리

3.1 텍스트 분류: BERT

___3.1.1 BERT

___3.1.2 BertTokenizer

___3.1.3 BertModel

___3.1.4 텍스트 분류 모델 학습

3.2 요약문 생성: BART

___3.2.1 BART

___3.2.2 BartTokenizer

___3.2.3 BartModel

___3.2.4 요약문 생성 모델 학습

3.3 질의 응답: RoBERTa

___3.3.1 RoBERTa

___3.3.2 추출 질의 응답 모델 학습

3.4 기계 번역: T5

___3.4.1 T5

___3.4.2 기계 번역 모델 학습

3.5 텍스트 생성: LLaMA-3.1

___3.5.1 LLaMA-3 시리즈

___3.5.2 텍스트 생성 모델 실습

___3.5.3 텍스트 생성 모델 학습

▣ 04장: 컴퓨터비전

4.1 제로샷 이미지 분류: CLIP

___4.1.1 CLIP

___4.1.2 제로샷 이미지 분류 수행

4.2 제로샷 객체 검출: OWLv2

___4.2.1 OWLv2

___4.2.2 제로샷 객체 검출 수행

4.3 이미지 세그먼테이션: SAM

___4.3.1 SAM

___4.3.2 이미지 세그먼테이션 수행

▣ 05장: 멀티모달

5.1 이미지 캡셔닝: BLIP-2

___5.1.1 BLIP

___5.1.2 이미지 캡셔닝 수행

5.2 문서 질의 응답: LayoutLM

___5.2.1 LayoutLM

___5.2.2 문서 시각 질의 응답 수행

5.3 시각적 질의 응답: ViLT

___5.3.1 ViLT

___5.3.2 시각적 질의 응답 수행

5.4 이미지 생성: Stable-Diffusion

___5.4.1 확산 모델

___5.4.2 Stable-Diffusion 3

___5.4.3 이미지 생성 수행

▣ 부록A: 이미지 매칭

A.1 이미지 특징 벡터

A.2 FAISS

A.3 인덱스 유형

▣ 부록B: 레이 튠

B.1 하이퍼파라미터 최적화 수행

B.2 하이퍼파라미터 최적화 결과 비교

B.3 하이퍼파라미터 검색 알고리즘

▣ 부록C: GPTQ

C.1 GPTQConfig 클래스

C.2 모델 양자화

▣ 부록D: 가속화

D.1 Accelerator 클래스

D.2 모델 분산 학습 수행

그럼 이상으로 딥러닝 프로젝트를 위한 허깅페이스 실전 가이드 책소개 포스팅을 마치겠습니다.

딥러닝 프로젝트를 위한 허깅페이스 실전 가이드 책소개 포스팅은 제휴마케팅이 포함되어있습니다.

#딥러닝, #허깅페이스, #프로젝트, #가이드, #강의, #강좌, #책, #서적

생성형 AI를 위한 컴퓨터 비전

생성형 AI를 위한 컴퓨터 비전 관련

책을 소개해드릴게요.

http://app.ac/v3Px1tJ83

 

생성형 AI를 위한 컴퓨터 비전 | 최재웅 - 교보문고

생성형 AI를 위한 컴퓨터 비전 | 수식으로 이해하고, 코드로 습득하고, 결과물로 알아보는 파이토치를 활용한 딥러닝과 비전 생성 모델이제는 누구나 쉽게 접할 수 있는 각종 생성형 AI 서비스는

product.kyobobook.co.kr

수식으로 이해하고, 코드로 습득하고, 결과물로 알아보는

파이토치를 활용한 딥러닝과 비전 생성 모델

이제는 누구나 쉽게 접할 수 있는 각종 생성형 AI 서비스는 컴퓨터 비전, 그중에서도 비전 생성 모델의 기술적 산물입니다. 인공지능과 관련된 전문가로 성장하기 위해서는 단순히 완성형으로 개발된 서비스를 이용해보기에 앞서 동작의 원리를 깨쳐야 합니다. 이에 『생성형 AI를 위한 컴퓨터 비전』은 미드저니, 빙 이미지 크리에이터, 스테이블 디퓨전, 스노우 앱 등의 서비스를 개발할 때 사용되는 이미지 및 영상 생성 관련 컴퓨터 비전 기술의 근간을 설명합니다.

비전 생성 모델과 관련된 각종 모델에 대해 수학 공식을 통해 수리적인 배경을 이해하고 소스코드를 한 줄씩 따라가며 동작 기술을 습득할 수 있습니다. 또한 텍스트 입력을 처리하는 트랜스포머, 이미지와 텍스트 프롬프트의 정보를 연결하는 CLIP 모델, 파이프라인 및 응용 기법 등을 지원하는 허깅페이스의 Diffuser 라이브러리와 함께 멀티 모달 비전 생성 모델의 결과 도출 방식을 알 수 있습니다. 이제는 생성형 AI 제품 및 서비스를 경험해보는 것을 넘어 책에서 제시하는 전망과 미래 잠재력에 동참해보도록 합시다.

저자(글) 최재웅

인물정보

전산통계전문가

대학교에서 전자공학을 전공하던 중 인공지능에 흥미가 생겨 대학원 진학을 결심하였습니다. 그리고 인하대학교의 컴퓨터 비전 및 이미지 프로세싱(Computer Vision and Image Processing, CVIP) 연구실에서 가장 흥미롭게 생각한 비전 분야의 생성 모델을 연구해 석사 학위를 취득하였습니다.

NHN에서는 스타일 변환 모델에 대한 서비스 개발을 진행했고 생성 모델 관련 특허를 여러 개 출원하였으며, 현재는 LG CNS에서 생성 모델 관련 연구 및 개발 업무를 수행하고 있습니다. 이 밖에, 공부한 것을 나누기를 좋아하여 멘사코리아의 개발자 모임에서 스터디를 주관하기도 하며 좋은 영향력을 펼칠 길을 찾아나가고 있습니다.

現) LG CNS - 멀티 모달 AI 팀

前) NHN - AI 선행연구팀

- 깃허브 github.com/jaewoong1

- 인스타그램 instagram.com/chlwodnd500

저술 사항

- 논문 「Style-Guided and Disentangled Representation for Robust Image-to-ImageTranslation」, (AAAI, 2022), 9.

- 저널 「Synthesized rain images for deraining algorithms」, (NeuroComputing, 2022), sciencedirect.com/science/article/pii/S0925231222004040

- 논문 「EPrOD: Evolved Probabilistic Object Detector with Diverse Samples」, (ECCV, 2020), 10.

목차

1장 비전 생성 모델

_1.1 비전 생성 모델이란?

__1.1.1 영상 생성 모델

__1.1.2 영상 변환 모델

__1.1.3 스타일 변환 모델

__1.1.4 영상 품질 개선 모델

_1.2 비전 생성 모델의 활용 분야

__1.2.1 예술 및 디자인

__1.2.2 엔터테인먼트

__1.2.3 의료 및 산업 분야

__1.2.4 게임 개발

_1.3 비전 생성 모델 이해를 위한 배경지식

__1.3.1 평균과 분산

__1.3.2 정규 분포

__1.3.3 최대 가능도 추정

__1.3.4 쿨백-라이블러 발산

__1.3.5 MAE 손실 함수와 MSE 손실 함수

_1.4 구현 및 실습을 위한 도구

__1.4.1 CUDA와 CuDNN 설치

__1.4.2 아나콘다 설치

__1.4.3 파이토치란?

2장 비전 생성 모델링 방식 및 특징

_2.1 오토 인코더

__2.1.1 소개 및 이론

__2.1.2 구현 및 실습

__2.1.3 정리

_2.2 변이형 오토 인코더

__2.2.1 소개 및 이론

__2.2.2 구현 및 실습

__2.2.3 정리

_2.3 생성적 적대 신경망

__2.3.1 소개

__2.3.2 GAN

__2.3.3 WGAN

__2.3.4 cGAN

__2.3.5 DCGAN

__2.3.6 구현 및 실습

__2.3.7 정리

_2.4 확산 모델

__2.4.1 소개 및 이론

__2.4.2 구현 및 실습

__2.4.3 정리

3장 생성적 적대 신경망 기반 응용 모델

_3.1 영상 생성 모델

__3.1.1 PGGAN

__3.1.2 StyleGAN

__3.1.3 정리

_3.2 영상 변환 모델

__3.2.1 pix2pix

__3.2.2 CycleGAN

__3.2.3 정리

_3.3 스타일 변환 모델

__3.3.1 AdaIN

__3.3.2 StarGAN

__3.3.3 정리

_3.4 영상 품질 개선 모델

__3.4.1 초해상도: SRGAN

__3.4.2 디블러링: DeblurGAN

__3.4.3 정리

4장 확산 모델 기반 응용 모델

_4.1 트랜스포머

_4.2 CLIP

_4.3 Diffusers 라이브러리란?

_4.4 멀티 모달 비전 생성 모델

__4.4.1 미드저니

__4.4.2 빙 이미지 크리에이터

__4.4.3 스테이블 디퓨전

__4.4.4 정리

_4.5 응용 및 확장 기법

__4.5.1 드림부스

__4.5.2 컨트롤넷

__4.5.3 정리

5장 최신 연구 및 서비스 동향

_5.1 관련 서비스 및 응용 분야 소식

_5.2 비전 생성 모델의 전망과 미래

출판사 서평

비전 생성 모델의 수리적 배경부터

응용 모델의 사용법과 결과 도출 원리까지

1장에서는 컴퓨터 비전 영역에 속한 생성형 AI 관련 모델인 비전 생성 모델에 대해 용어를 정의하고 수리적인 배경을 학습한 후 구현 및 실습에 필요한 도구를 설치합니다.

2장에서는 대표적인 생성 모델링 방식인 오토 인코더, 변이형 오토 인코더(VAE), 생성적 적대 신경망(GAN), 그리고 확산 모델(Diffusion Model)에 대해 이론부터 실습까지 코드를 한 줄씩 따라가며 꼼꼼하게 살펴봅니다.

3장에서는 영상 생성 모델(PGGAN, StyleGAN), 영상 변환 모델(pix2pix, CycleGAN), 스타일 변환 모델(AdalN, StarGAN), 영상 품질 개선 모델(초해상도: SRGAN, 디블러링: DeblurGAN)에 대해 수학 공식을 통한 수리적인 배경부터 소스코드를 통한 설명과 결과 이미지 확인까지 세밀하게 고찰해봅니다.

4장에서는 텍스트 입력을 처리할 수 있게 하는 트랜스포머, 이미지와 텍스트 프롬프트의 정보를 연결하는 CLIP 모델, 파이프라인 및 응용 기법 등을 지원하는 허깅페이스의 Diffuser 라이브러리에 대해 알아봅니다. 그리고 미드저니, 빙 이미지 크리에이터, 스테이블 디퓨전 등의 생성 서비스에 사용된 멀티 모달 비전 생성 모델에 대해 각 서비스를 기준으로 수리적인 배경과 결과 도출 방식을 살펴봅니다.

5장에서는 모바일 애플리케이션 스노우(SNOW), 어도비의 생성형 AI 플랫폼 젠스튜디오(GenStudio), 오픈AI의 Text-to-Video 생성 모델 소라(Sora) 등을 소개하며 비전 생성 모델의 전망과 미래 잠재력을 조망해봅니다.

이 책이 필요한 독자

- 딥러닝과 영상 변환 모델 기술에 대해 궁금한 분

- 비전 생성 모델을 처음 접하는 대학생 또는 대학원생

- 이미지 및 영상 생성 관련 인공지능 기술을 직접적인 수식과 코드로 학습하고 싶은 분

- 비주얼 분야에서의 인공지능에 대해 학습하고 싶은 분

- 디자인 및 그래픽 관련 분야에서 인공지능 모델을 활용해보고 싶은 분

그럼 이상으로 생성형 AI를 위한 컴퓨터 비전 파이토치를 활용한 딥러닝과 비전 생성 모델 책소개 포스팅을 마치겠습니다.

생성형 AI를 위한 컴퓨터 비전 파이토치를 활용한 딥러닝과 비전 생성 모델 책소개 포스팅은 제휴마케팅이 포함되어있습니다.

#생성형AI, #컴퓨터비전, #파이토치, #딥러닝, #비전, #생성모델, #책, #강의, #강좌

+ Recent posts