파이썬 데이터 분석가 되기 + 챗GPT

파이썬 데이터 분석에 도움이 될 만한 책을 소개해드릴게요.

http://app.ac/HbM78yl43

 

파이썬 데이터 분석가 되기 + 챗GPT | 셀레나 - 교보문고

파이썬 데이터 분석가 되기 + 챗GPT | ★ 파이썬으로 데이터 분석을 하고 싶다면? ★ 파이썬 입문 그다음에 꼭 보세요! ★ ‘패스트캠퍼스’, ‘메가스터디’ 셀레나 쌤과 함께 실패 없이 완주하

product.kyobobook.co.kr

★ 파이썬으로 데이터 분석을 하고 싶다면?

★ 파이썬 입문 그다음에 꼭 보세요!

★ ‘패스트캠퍼스’, ‘메가스터디’ 셀레나 쌤과 함께 실패 없이 완주하세요!

실력을 갖춘 데이터 분석가로 성장하려면 시작이 중요합니다. 그래서 이 책은 무엇부터 익혀야 하는지 막막한 입문자에게 데이터 분석 로드맵을 제시하고 개념과 실습, 그리고 실무팁까지 차근차근 설명합니다. 또한 챗GPT로 공부하는 방법을 함께 소개하여 다양한 관점에서 데이터 분석을 학습할 수 있도록 준비했습니다. 이어서 파이썬 데이터 분석에 꼭 필요한 5대장인 넘파이, 판다스, 맷플롯립, 시본, 뷰티풀수프를 최신 트렌드에 맞게 그리고 실무에 유용하게 알려줍니다. 모든 장 끝에는 연습문제가 수록되어 있어 배운 내용을 점검할 수 있습니다.

〈되기〉 시리즈 소개

〈되기〉 시리즈는 이름 그대로 IT 분야에서 성장하려는 여러분을 위해 준비한 책입니다. 엄선된 IT 기술들을 로드맵과 함께 제시하고, 실무 중심으로 공부할 수 있도록 안내합니다. 여러분이 해당 분야에서 실무자로 빠르게 성장할 수 있도록 지원하겠습니다.

저자(글) 셀레나

인물정보

강사/학원장

패스트캠퍼스, 메가스터디, 국비 지원 강의를 통해 5,000명 이상의 수강생을 온라인과 오프라인에서 만나며 데이터 분석을 가르쳐 왔습니다. 수강생들이 데이터 분석을 처음 접할 때 겪는 어려움과 고민을 가까이에서 지켜보며, 어떻게 하면 더 쉽게 이해하고 실습할 수 있을지 끊임없이 고민했습니다. 이러한 경험을 바탕으로 누구나 부담 없이 데이터 분석을 시작할 수 있는 안내서가 되기를 바라며 이 책을 집필하였습니다.

강의 및 컨설팅

- 패스트캠퍼스 : '실패 없이 완주하는 파이썬 데이터 분석 입문' 강의 런칭

- 삼성전자 : Citizen Developer 양성 과정 '파이썬 프로그래밍 기초'

- 대한의료정보학회 : '의료 데이터를 활용한 실전 분석' 튜토리얼

- 서강대학교, 숙명여자대학교, 한국교통대학교 : '파이썬을 활용한 머신러닝 및 데이터 분석 실습' 외 강의 및 컨설팅 진행

목차

01장 수치 계산 라이브러리, 넘파이

_01.1 넘파이와의 첫 만남

__넘파이 사용하기

_01.2 넘파이 배열, ndarray

__1차원 배열 알아보기

__2차원 배열 알아보기

__3차원 배열 알아보기

__넘파이 배열의 축 이해하기

__넘파이의 축 번호는 왜 그럴까?

__넘파이 배열의 데이터 타입 살펴보기

__데이터 타입 확인해보기

__넘파이 배열의 장점 알아보기

__다양한 방법으로 넘파이 배열 생성하기

__넘파이 배열 속성 이해하고 출력해보기

__[챗GPT와 함께] 넘파이 3차원 배열 생성해보기

__초기화 함수로 넘파이 배열 생성하기

__일정한 간격의 넘파이 배열 생성하기

__arange( ) 함수와 linspace( ) 함수 비교하기

_01.3 넘파이 배열로 다양하게 연산하기

__요소별 연산해보기

__[챗GPT와 함께] 넘파이 사칙연산 구하기

__수학 함수, 집계 함수와 함께 벡터화 연산해보기

_01.4 배열 인덱싱과 슬라이싱

__인덱스 이해하기

__단일 요소 인덱싱 이해하기

__슬라이싱 이해하기

__논리형 인덱싱 이해하기

__정수 배열 인덱싱 이해하기

__[챗GPT와 함께] 넘파이 배열의 슬라이싱을 다른 프로그래밍 언어와 비교하기

_01.5 배열의 형태 변형하기

__배열의 형태를 변형하여 새 배열을 반환하는reshape( ) 함수

__[챗GPT와 함께] reshape( ) 함수에서 -1을 쓰는 이유는 뭘까?

__원본 배열의 형태를 변형하는 resize( ) 함수

__1차원 배열로 변형하기

__전치 연산하기

_01.6 배열 합치고 분할하기

__배열 합치기

__배열 분할하기

__학습 마무리

__연습문제

02장 데이터 처리 라이브러리, 판다스

_02.1 판다스 시작하기

__판다스와 넘파이의 특징

__판다스와 넘파이의 관계

__판다스를 사용해야 하는 이유

__시리즈란?

__데이터프레임이란?

__데이터 다운로드하고 다시 업로드하여 살펴보기

__판다스의 데이터 타입 알아보기

__[챗GPT와 함께] 샘플 데이터 생성 후 판다스에서 읽어보기

_02.2 데이터 내용 확인하기

__데이터의 열과 행 확인하기

__데이터의 처음과 마지막 부분 확인하기

__데이터 구조 살펴보기

__[챗GPT와 함께] 데이터 구조 살펴보기

_02.3 특정 열 선택하기

__시리즈 반환하기

__데이터프레임 반환하기

__[챗GPT와 함께] 판다스 특정 열 선택을 조건으로 활용하기 (1)

__[챗GPT와 함께] 판다스 특정 열 선택을 조건으로 활용하기 (2)

_02.4 데이터 필터링하기

__비교 연산자 〉로 필터링하기

__부정 연산자 ~로 필터링하기

__논리 연산자 &나 |로 필터링하기

__[챗GPT와 함께] 데이터 필터링 기능 활용하기

__loc[ ]와 iloc[ ]로 필터링하기

__isin( ) 함수로 특정 값 필터링하기

__[챗GPT와 함께] isin( ) 함수와 조건문 비교하기

_02.5 결측치 처리하기

__결측치가 뭐죠?

__결측치 처리가 중요한 이유?

__결측치 처리, 어떻게 해야 할까요?

__결측치 확인하기

__결측치 처리하기

__결측치를 처리한 데이터프레임을 파일로 저장하기

__[챗GPT와 함께] 결측치에 대해 물어보자!

_02.6 데이터 통계 처리하기

__통계 구하기

__그룹별 집계하기

__[챗GPT와 함께] agg( ) 함수를 이용하여 통계 분석하기

_02.7 데이터프레임에 행이나 열 추가하거나 삭제하기

__행과 열 추가하기

__행과 열 삭제하기

__학습 마무리

__연습문제

03장 데이터 시각화 라이브러리, 맷플롯립

_03.1 맷플롯립 시작하기

__맷플롯립 소개

__맷플롯립 사용하기

__[챗GPT와 함께] 맷플롯립 장점 알아보기

_03.2 그래프 꾸미기

__축과 관련 있는 옵션 사용해보기

__선과 관련 있는 옵션 사용해보기

__[챗GPT와 함께] 맷플롯립 그래프 색상 설정하기

__제목 관련 옵션 사용해보기

__그래프 배경 관련 옵션 사용해보기

__[챗GPT와 함께] 맷플롯립 그래프 그리기

_03.3 다양한 그래프 그려보기(1)

__타이타닉 데이터셋 소개

__선 그래프 : 객실 등급에 따른 생존율 표시하기

__수직 막대 그래프 : 각 승선 항구에 따른 생존자 수 확인하기

__수평 막대 그래프 : 각 승선 항구에 따른 생존자 수 확인하기

__산점도 그래프 : 나이와 요금, 생존 여부 확인하기

__파이 차트 : 생존자, 사망자 비율 표현하기

__히스토그램 : 승객의 나이 분포 표시하기

_03.4 다양한 그래프 그려보기(2)

__히트맵 : 두 변수의 상관 관계를 표시하기

__영역 채우기 그래프 : 나이대별 생존자와 사망자 수 표현하기

__박스 플롯 : 승객 나이의 데이터 분포, 중앙값, 이상치 살펴보기

__바이올린 플롯 : 승객 등급에 따른 나이 분포 표시하기

__[챗GPT와 함께] 맷플롯립 박스플롯과 바이올린 플롯 활용에 대해 알아보기

__에러 바 : 요금의 평균과 표준편차 표현하기

__[챗GPT와 함께] 맷플롯립 에러바를 이용한 기업 월간 주가 확인하기

_03.5 그래프 한꺼번에 그려보기

__여러 종류의 그래프 그리는 방법 원리 설명

__개별 서브플롯을 하나씩 생성하기

__타이타닉 데이터셋으로 개별 서브플롯 하나씩 그리기

__개별 서브플롯을 동시에 생성하기

__타이타닉 데이터셋으로 개별 서브플롯 동시에 그리기

__하나의 서브플롯에 여러 그래프 그리기

__[챗GPT와 함께] 타이타닉 승객 등급별 요금 분포와 생존율 시각화하기

_03.6 그래프 저장하기

__학습 마무리

__연습문제

04장 데이터 시각화라이브러리, 시본

__04.1 시본 기본 개념

__시본 자체 데이터셋 불러오기

__팁 데이터셋 불러오기

__[챗GPT와 함께] Seaborn은 왜 별칭이 sns일까?

_04.2 여섯 가지 그래프 이해하기

__시본 그래프는 어떤 것들이 있을까?

__범주형 변수 산점도 그래프

__빈도 그래프

__선형 회귀선이 있는 산점도 그래프

__히스토그램과 커널 밀도 추정 그래프

__조인트 그래프

__관계 그래프

__[챗GPT와 함께] 이상치 탐지 그래프는 어떤 그래프로?

__학습 마무리

__연습문제

05장 웹 데이터 수집라이브러리, 뷰티풀수프

_05.1 웹 데이터 수집 기본 개념

__웹 데이터를 수집할 때 주의할 점

__[챗GPT와 함께] robots.txt 알아보기

__[챗GPT와 함께] 야후 파이낸스와 네이버 파이낸스의 robots.txt 비교하기

__웹 데이터 수집 용어 정리하기

__웹 스크래핑은 어떤 과정으로 수행될까?

__뷰티풀수프 기초 사용 방법 알아보기

__웹 스크래핑 원리 이해하기

_05.2 야후 파이낸스 주가 데이터 웹 스크래핑하기

__웹 페이지 파악하기

__헤더에 사용자 에이전트 값 추가하기

__삼성전자 종목 일별 시세 페이지 요청하기

__뷰티풀 수프로 데이터 추출하고 날짜, 원 표시하기

__for문으로 순회하면서 전체 날짜, 종가 데이터 가져오기

__수집한 데이터로 그래프 시각화하기

__[챗GPT와 함께] 날짜와 종가 데이터로 막대 그래프 그리기 346

__[챗GPT와 함께] 주식 데이터를 웹 스크래핑할 추가적인 사이트 349

__학습 마무리

__연습문제

06장 넷플릭스 데이터 분석 프로젝트

_06.1 넷플릭스 데이터 분석 프로젝트 소개

__여기서 사용하는 라이브러리

__데이터 분석 목표

__데이터 전처리 과정

__데이터 시각화 미리보기

_06.2 넷플릭스 데이터셋 파악하기

__캐글의 넷플릭스 데이터셋?

__[챗GPT와 함께] 캐글의 데이터 분석할 데이터셋 추천받기!

__넷플릭스 데이터셋 변수 살펴보기

__넷플릭스 데이터셋 불러와 살펴보기

_06.3 넷플릭스 데이터셋 결측치 처리하기

__넷플릭스 결측치 비율 확인하고 처리하기

_06.4 넷플릭스 피처 엔지니어링하기

__피처 엔지니어링은 어디에 쓰이나요?

__[챗GPT와 함께] 피처 엔지니어링 더 해보기

_06.5 넷플릭스 시각화하기 380

__데이터 전처리 완료한 데이터셋 불러오기

__넷플릭스 색상 시각화하기 380

__넷플릭스 오징어 게임 검색하기

__넷플릭스 파이 차트 그리기

__넷플릭스 막대 그래프 그리기

__넷플릭스 히트맵 그리기

__넷플릭스 워드 클라우드

__[챗GPT와 함께] 워드 클라우드 더 해보기

__학습 마무리

07장 의료 데이터 분석 프로젝트

_07.1 의료 데이터 분석 프로젝트 소개

__여기서 사용하는 라이브러리

__데이터 분석 목표

__데이터 전처리 과정

__데이터 시각화 미리보기

_07.2 의료 데이터셋 파악하기

__심부전 데이터셋이란?

__심부전 데이터셋 불러온 다음 내용 확인하기

_07.3 심부전 데이터셋 필터링하기

__논리형 인덱싱으로 데이터 필터링하기

_07.4 심부전 데이터셋 결측치 처리하기

__결측치 비율 확인하기

__결측치 처리하기

__결측치 처리 후에 결측치 개수 다시 확인하기

__[챗GPT와 함께] 결측치를 처리하는 방법이 궁금해!

_07.5 심부전 데이터셋 통계 처리하기

__평균값과 중앙값 구하기

__열의 빈도수 구하기

__통계량 요약하기

__그룹별 집계하기

__[챗GPT와 함께] 심부전 데이터셋을 이용한 피처 엔지니어링

_07.6 심부전 데이터셋 시각화하기

__심부전 색상 시각화하기

__심부전 파이 차트 그리기

__심부전 빈도 그래프 그리기

__심부전 데이터 영역 그래프 그리기

__심부전 범주형 산점도 그래프 그리기

__심부전 워드 클라우드 그리기

__[챗GPT와 함께] 추가적인 시각화를 진행해보자

__학습 마무리

책 속으로

★ 환영합니다, 파이썬 입문 그다음 책을 소개합니다!환영합니다. 데이터 분석가가 되고 싶은데 무엇을 어떻게 할지 모르겠는 분이라면, 잘 찾아오셨습니다. 이 책은 파이썬을 공부했거나, 데이터 분석에 입문하고 싶은 분들에게 필요한 내용을 알려줍니다. 데이터 분석의 기본을 체계적으로 다지고 싶은 예비 데이터 분석가에게 유용합니다. 처음에 공부하면 이해하기 어려운 추상적인 데이터 구성은 그림과 함께 설명하여 아주 쉽게 읽을 수 있습니다. 데이터 분석 분야에 꼭 필요한 파이썬, 넘파이, 판다스, 맷플롯립, 시본, 그리고 데이터 수집에 필요한 뷰티풀수프까지! 이 책 한 권으로 데이터 분석에 입문해보세요!

파이썬 데이터 분석 5대장으로 공부하세요하나, 넘파이넘파이는 파이썬에서 수치 계산을 효율적으로 처리하는 라이브러리입니다. 다차원 배열 객체인 ndarray를 제공하며, 벡터 및 행렬 연산을 빠르게 수행할 수 있습니다. 또한, 다양한 수학 함수와 통계 함수도 지원하여 데이터 분석, 과학 계산, 머신러닝 등에 널리 사용됩니다.

둘, 판다스판다스는 파이썬에서 데이터 분석을 쉽게 할 수 있도록 돕는 라이브러리입니다. 주로 표 형식의 데이터를 다루는 데 사용되며, 데이터프레임과 시리즈 같은 자료구조를 제공해 데이터 조작, 필터링, 정렬, 집계 등을 효율적으로 처리합니다. 엑셀, CSV 등 다양한 파일 형식에서 데이터를 불러오고 처리할 수 있어 데이터 분석, 전처리에 널리 활용됩니다.

셋, 맷플롯립파이썬에서 데이터를 시각화하는 라이브러리입니다. 다양한 유형의 차트(선 그래프, 막대 그래프, 산점도 등)를 만들 수 있으며, 데이터를 시각적으로 표현해 분석 및 인사이트 도출을 돕습니다. 그래프의 스타일, 레이블, 축 등을 세밀하게 조정할 수 있어 데이터 시각화에 유연성과 강력한 기능을 제공합니다. 데이터 분석, 보고서 작성, 프레젠테이션 등에 자주 사용됩니다.

넷, 시본시본은 파이썬의 데이터 시각화 라이브러리로, 맷플롯립을 기반으로 더 간편하고 아름다운 그래프를 만들 수 있도록 도와줍니다. 시본은 데이터 분석에 자주 쓰이는 히트맵, 카테고리형 그래프, 분포형 그래프 등을 손쉽게 만들 수 있습니다. 특히 판다스와 잘 통합되어 데이터프레임을 직접 시각화할 때 유용합니다. 시본을 사용하면 그래프의 스타일과 색상 팔레트를 간단하게 조정할 수 있습니다.

다섯, 뷰티풀수프뷰티풀수프는 웹 페이지의 HTML이나 XML 문서를 파싱하여 데이터를 추출하는 파이썬 라이브러리입니다. 웹 스크래핑을 할 때 주로 사용하며, 웹사이트의 구조를 분석해 원하는 데이터(텍스트, 링크, 이미지 등)를 손쉽게 추출할 수 있습니다. 웹 페이지에서 데이터를 가져오고, 그 내용을 파싱해 필요한 정보를 추출하는 과정에서 매우 유용합니다. 뷰티풀수프는 복잡한 HTML 구조도 직관적으로 탐색할 수 있도록 돕습니다.

〈되기〉 시리즈는 여러분에게 앞으로 나아갈 길을 먼저 제시합니다

입문자를 위한 데이터 분석 로드맵을 만나보세요데이터 분석에 입문할 때 겪은 난감함을 생각했습니다. 무엇을 어떻게 할지 몰랐습니다. 로드맵이

필요했습니다. 하지만 누구도 제대로 된 로드맵을 제공해주지 않았습니다. 그래서 이 책은 로드

맵을 제공합니다. 로드맵에는 수많은 기술이 나열되어 있습니다. 책 한 권에 로드맵에 있는 모든 걸 담을 수도, 한 번에 모두 배울 수도 없지만 데이터 분석 입문에 꼭 필요한 내용은 모두 담기 위해 노력했습니다. 로드맵과 함께 어떤 방향으로 나아가야 할지 바라보며 공부해보세요.

- 온라인에서 보는 로드맵 : roadmap.sh/r/rdm-q8fbj

실무에 유용한 기술로 익히세요기술은 빠르게 변합니다. 지금은 대세이지만 지는 기술, 아직은 미약하지만 뜨는 기술이 있습니다. 트렌드가 변하는 데는 그럴 만한 이유가 있습니다. 반면 기본은 트렌드와 무관하게 변하지 않습니다. 그래서 기본은 탄탄하게, 기술셋은 트렌디하면서 실무에 유용하게 설명했습니다.

챗GPT와 함께 공부하세요이제는 챗GPT를 사용하지 않는 사람이 없습니다. 챗GPT가 만능은 아니지만 잘만 사용하면 어려운 문제를 쉽게 해결할 수도 있고, 모르는 내용을 더 쉽게 공부할 수도 있습니다. 다만 챗GPT는 질문에 기술이 필요하고, 잘 쓰는 사람은 어떻게 질문하는지 알아둘 필요가 있습니다. 그래서 이 책은 중간 중간 챗GPT와 함께 공부합니다. 선생님의 질문 노하우를 보면서 챗GPT와 함께 공부해보세요.

200% 학습 효율이 오르는 7가지 학습 가이드초보자가 데이터 분석에 필요한 환경 설정을 하는 건 너무 어려운 일입니다. 물론 제대로 된 환경을 만들고 싶을 수도 있습니다만 그보다 더 중요한 건 기초 개념을 실습하고 익히는 것이죠. 그래서 이 책은 설치 없이 바로 공부할 수 있도록 구글 드라이브와 구글 코랩으로 실습을 안내합니다.

하나, 구글에 가입하세요(무료)구글에 가입하면 파이썬 데이터 분석을 할 수 있는 코랩을 무료로 사용할 수 있습니다. 구글 계정

을 준비해주세요.

둘, 내 드라이브에 코랩 파일을 만드세요➊ 내 드라이브에 적당한 폴더를 만든 다음 ➋ 마우스 오른쪽 클릭 → ➌ 더보기 → ➍ Google Colaboratory를 누르면 구글 코랩 파일을 만들어 코랩을 사용할 수 있습니다.

셋, 코랩에서 코드를 입력하고 실행해보세요➊ 처음 파일을 만들면 코드를 입력할 수 있는 줄이 있습니다. 만약 새로운 코드를 입력하고 싶으면 [+ 코드]를 누르면 코드를 입력할 수 있는 줄이 생깁니다. ➋ 코드를 다 입력한 다음에는 ▶를 누르거나 [Shift + Enter]를 누르면 코드를 실행합니다. ➌ 코드를 실행한 결과는 코드 줄 아래에 바로 생깁니다. ➍ 코드를 실행하면 바로 다음 줄에 입력할 수 있는 줄이 생깁니다.

넷, 실습용 파일, 완성 파일은 모두 여기에 있습니다실습에 필요한 파일이나 완성 파일은 모두 bit.ly/4dXk2Ef에 장별로 구분하여 업로드해두었습니다. 다운로드 링크는 실습 진행 중에 바로 확인할 수 있도록 본문에서도 안내합니다. 필요할 때마다 다운로드하여 활용하세요.

다섯, 실습 화면을 왼쪽에, 정답 화면을 오른쪽에 놓고 실습하세요데이터 분석이 처음이라면 내가 입력한 코드가 잘 실행되지 않을 수 있습니다. 초보라면 당연한 일입니다. 이 책은 그런 여러분들을 위해 실습 환경 파일과 정답 파일을 병렬로 제공합니다. 실습 화면을 왼쪽에, 정답 화면을 오른쪽에 두고 실습해보세요.

여섯, 저자 선생님과 함께! 오픈카톡방을 활용하세요책으로 봐도, 정답 코드를 봐도 어렵다면?! 저자 선생님과 함께 공부해보세요. 데이터 분석 입문자에게 길을 열어주고 싶은 선생님이 오픈카톡방에 계십니다. 오픈카톡방의 명령어를 활용해서 다양한 자료도 쉽게 얻어보세요.

- 오픈카톡방 링크 : open.kakao.com/o/gm8FtZUg

일곱, 유튜브 강의도 활용해보세요저자 선생님 유튜브 동영상 강의도 있습니다. 함께 공부하거나 이동하면서 공부하고 싶을 때 유튜브 채널에 방문하여 영상으로 공부해보세요.

- 유튜브 채널 링크[셀레나쌤] : www.youtube.com/@SELENASSAM

출판사 서평

“수많은 강의와 교재 속에서 망설이고 있는 데이터 분석 입문자가 있다면 이 책을 권해주고 싶다. 넘파이를 이용하여 배열을 만들고 간단한 숫자들을 처리하는 방법부터 맷플롯립과 시본을 이용한 데이터 분석 및 시각화 방법과 뷰티풀수프를 이용한 웹 데이터 수집과 주가 데이터 분석까지 살펴본 후, 넷플릭스 데이터와 의료 데이터 분석 프로젝트를 수행하다보면 어느덧 데이터 분석 전문가의 길에 들어서고 있는 자신을 발견할 수 있을 것이다. 챗GPT로 데이터를 생성하여 활용하는 팁도 가득하다.”

서강대학교 컴퓨터공학과 박운상 교수

“파이썬 데이터 분석을 처음 접하는 독자들이 체계적으로 기초부터 차근차근 쌓아갈 수 있도록 세심하게 구성되어 있습니다. 그뿐만 아니라 실전 데이터 분석을 실무에 바로 적용할 수 있도록 넘파이, 판다스, 맷플롯립, 시본 등 필수 도구들의 활용 방법을 심도 있게 다루고 있습니다. 또 넷플릭스와 의료 데이터를 활용한 예제 프로젝트를 통해 흥미로운 실전 경험을 제공합니다. 파이썬과 데이터 분석을 처음 시작하는 분뿐만 아니라, 실무에서 데이터 분석 역량을 발전시키고자 하는 분에게도 든든한 가이드가 되기를 기대합니다.

서울아산병원 빅데이터연구센터 오지선 소장

“저자의 실무 경험과 전문성을 바탕으로 이번에 출간된 〈파이썬 데이터 분석가 되기〉는 그녀의 풍부한 지식과 역량이 집약된 결실이라 할 수 있습니다. 특히 실무 경험을 바탕으로 한 다양한 코멘트는 독자가 직접 데이터를 분석하고 활용해 나가면서 문제 해결 능력을 키우고 스스로 성장할 수 있는 길을 제시합니다. 또한 급변하는 데이터 분석 환경에 등장한 챗GPT를 활용하여 책의 내용을 쉽게 습득할 수 있고 다양한 궁금증을 해결할 수 있도록 돕습니다.

숙명여자대학교 소프트웨어학과 채희준 교수

오랫동안 고민해왔던 파이썬 데이터 분석의 교재에 대한 고민을 말끔하게 씻어주는 책이다. 웹 크롤링, 넷플릭스 데이터 분석, 의료 데이터 분석이라는 3가지 프로젝트를 제시하여 데이터 전처리, 데이터 시각화 및 분석을 사례로 제시하였는데 데이터 분석가를 목표로 공부하려는 학생들에게 매우 적절하다. 파이썬 응용, 파이썬 데이터시각화, 파이썬 데이터 분석 등의 주제나 교과목에서 교재로 사용하기에도 매우 유용한 도구라 할 수 있다.

숙명여자대학교 융합학부 박영민 교수

그럼 이상으로 파이썬 데이터 분석가 되기 + 챗GPT 파이썬, 넘파이, 판다스, 맷플롯립, 시본, 뷰티풀수프파이썬 데이터 분석 입문자를 위한 풀 패키지 책소개 포스팅을 마치겠습니다.

파이썬 데이터 분석가 되기 + 챗GPT 파이썬, 넘파이, 판다스, 맷플롯립, 시본, 뷰티풀수프파이썬 데이터 분석 입문자를 위한 풀 패키지 책소개 포스팅은 제휴마케팅이 포함되어있습니다.

#파이썬, #데이터분석, #챗GPT, #넘파이, #판다스, #맷플롯립, #시본, #뷰티플수프, #책, #강의, #강좌

데이터 분석을 위한 

판다스 입문책을 소개해드릴게요.

https://app.ac/GqprMp283

 

Do it! 데이터 분석을 위한 판다스 입문 | 다니엘 첸 - 교보문고

Do it! 데이터 분석을 위한 판다스 입문 |

product.kyobobook.co.kr

파이썬 기초 문법만 알아도 OK!

테슬라 주식, 빌보드 차트 등 16개의 현실 데이터와 115개의 예제로 판다스의 기본을 확실히 익히자!

이미 1만여 명의 독자가 선택한 《Do it! 데이터 분석을 위한 판다스》가 파이썬 3.11.X 버전과 판다스 2.X 버전에 맞춰 개정하였다. 기존 판보다 100쪽 이상 증보되어 더 자세하고 친절하다. 파이썬 기초를 뗐다면 이 책으로 판다스를 공부하기 어렵지 않다. 이 책은 판다스의 주요 용어, 원리와 개념은 물론, 넘파이, 맷플롯립이나 시본, 시계열 데이터 등 파이썬 데이터 분석의 기본기를 익힐 수 있다. 이와 더불어 과학, 경제, 종교, 엔터테인먼트, 의학, 사회 등 다양한 분야의 현실 데이터셋을 활용한 판다스와 데이터 분석 실습 예제 115개로 실무 감각을 키울 수 있다는 점도 특징이다.

작가정보

저자(글) 다니엘 첸

인물정보

프로그래머

(Daniel Y. Chen)

2013년부터 소프트웨어 카펜트리(Software Carpentry)에서 지금까지 데이터 분석 강사와 멘토링 활동을 하고 있습니다. 그뿐만 아니라 2016년부터는 매년 국제 파이썬 커뮤니티인 사이파이(SciPy)에서 판다스 강의를 진행하고 있습니다.

인물정보

번역가/통역사>영어 프로그래머

자연어 처리 연구를 진행하며 챗봇을 개발하는 평범한 개발자입니다. 새로운 분야나 지식을 접하고 공부하기를 좋아하고 학습과 지식 공유를 목표로 번역 활동을 하고 있습니다. 지금까지 《행동 데이터 분석》, 《판다스 인 액션》, 《자바 코딩 인터뷰 완벽 가이드》, 《엑셀, R, 파이썬으로 시작하는 데이터 분석》 등을 번역했습니다.

목차

01 판다스 실습 환경 준비하기

__01-1 아나콘다 설치하기

__01-2 판다스 실습 준비하기

__01-3 안녕? 주피터 노트북!

__01-4 파이썬 패키지 관리자 pip 알아보기

02 판다스 시작하기

__02-1 판다스가 왜 필요할까?

______ 데이터프레임과 시리즈

__02-2 데이터셋 불러오기

______ 데이터 분석은 데이터셋 불러오기부터

__02-3 데이터 추출하기

______ 열 데이터 추출하기

______ 행 데이터 추출하기

______ loc와 iloc로 데이터 추출하기

______ 행과 열 함께 지정하여 추출하기

__02-4 기초 통계 계산하기

______ 그룹화한 데이터의 평균 구하기

______ 그룹화한 데이터 개수 세기

__02-5 데이터를 그래프로 표현하려면?

03 판다스 자료구조 살펴보기

__03-1 나만의 데이터 만들기

______ 시리즈와 데이터프레임 만들기

__03-2 시리즈 다루기

______ 시리즈의 keys() 메서드

______ 시리즈와 ndarray

______ 시리즈와 불리언

______ 시리즈와 브로드캐스팅

__03-3 데이터프레임 다루기

______ 데이터프레임의 구성

______ 데이터프레임과 불리언 추출

______ 데이터프레임과 브로드캐스팅

__03-4 시리즈와 데이터프레임 데이터 변환하기

__03-5 데이터 저장하고 불러오기

______ 피클로 저장하고 불러오기

______ CSV와 TSV 파일로 저장하고 불러오기

______ 엑셀로 저장하기

______ 다양한 형식으로 저장하기

______ 다양한 데이터 저장 유형

04 그래프 그리기

__04-1 데이터 시각화란?

__04-2 matplotlib 라이브러리란?

______ 그림 영역과 하위 그래프 이해하기

______ 그래프 구성 요소 이해하기

__04-3 matplotlib으로 그래프 그리기

______ 일변량 그래프 그리기

______ 이변량 그래프 그리기

______ 다변량 그래프 그리기

__04-4 seaborn으로 그래프 그리기

______ 다양한 그래프 그려 보기

______ seaborn 스타일 알아보기

______ seaborn 공식 문서 읽는 방법

__04-5 판다스로 그래프 그리기

05 깔끔한 데이터 만들기

__05-1 깔끔한 데이터란?

__05-2 열 이름이 값일 때

______ 하나의 열만 남기기

______ 여러 개의 열 남기기

__05-3 열 이름에 변수가 여러 개일 때

______ 열 이름이 여러 가지 뜻일 때

______ 열 이름 분할하고 새로운 열로 할당하기

______ 한 번에 분할하고 합치기

__05-4 변수가 행과 열 모두에 있을 때

06 apply() 메서드로 함수 적용하기

__06-1 간단한 함수 만들기

__06-2 apply() 메서드 사용하기

______ 시리즈에 함수 적용하기

______ 데이터프레임에 함수 적용하기

__06-3 람다 함수 사용하기

__06-4 벡터화된 함수 사용하기

______ 넘파이와 넘바로 벡터화하기

07 데이터 결합하고 분해하기

__07-1 데이터 묶어 분석하기

__07-2 데이터 연결하기

______ 데이터프레임 살펴보기

______ 행 연결하기

______ 열 연결하기

______ 인덱스나 열 이름이 다른 데이터 연결하기

__07-3 분할된 데이터 연결하기

__07-4 여러 데이터셋 병합하기

__07-5 데이터 정규화하기

08 그룹으로 묶어 연산하기

__08-1 데이터 집계하기

______ groupby() 메서드와 함께 사용하는 집계 메서드

______ agg() 메서드와 groupby() 메서드 조합하기

______ 여러 개의 집계 함수 한 번에 사용하기

__08-2 데이터 변환하기

______ 표준점수 계산하기

______ 평균값으로 결측값 채우기

__08-3 원하는 데이터 걸러 내기

__08-4 그룹 객체 활용하기

______ 그룹 객체란?

__08-5 다중 인덱스 다루기

09 결측값 알아보기

__09-1 결측값이란?

__09-2 결측값은 왜 생길까?

______ 데이터를 불러올 때 생기는 결측값

______ 데이터를 연결할 때 생기는 결측값

______ 직접 입력한 결측값

______ 인덱스를 다시 설정할 때 생기는 결측값

__09-3 결측값 다루기

______ 결측값 처리하기

______ 결측값이 있는 데이터 계산하기

__09-4 판다스 내장 NA 결측값 살펴보기

10 자료형 더 알아보기

__10-1 자료형 살펴보기

__10-2 자료형 변환하기

__10-3 범주형 데이터 알아보기

______ 범주형 데이터 다루기

11 문자열 처리하기

__11-1 문자열 다루기

______ 인덱스로 문자열 추출하기

______ 슬라이싱 구문으로 마지막 문자 추출하기

__11-2 자주 사용하는 문자열 메서드

__11-3 문자열 메서드 더 알아보기

__11-4 문자열 포매팅 알아보기

__11-5 정규식으로 문자열 처리에 날개 달기

______ 정규식이란?

______ compile() 함수

__11-6 regex 라이브러리 활용하기

12 시계열 데이터 알아보기

__12-1 datetime 객체 활용하기

__12-2 datetime으로 변환하기

__12-3 시계열 데이터 불러오기

__12-4 시간 정보 추출하기

__12-5 시간 간격 계산하기

__12-6 datetime 객체의 메서드 활용하기

__12-7 주식 데이터 다루기

__12-8 시간별 데이터 추출하기

__12-9 시간 범위 다루기

______ 시간 범위의 주기 설정하기

__12-10 열 방향으로 값 옮기기

__12-11 시간 주기 변경하기

__12-12 시간대 다루기

__12-13 시계열 데이터 다루는 방법 더 알아보기

찾아보기

출판사 서평

이 책의 주요 내용

ㆍ 판다스로 깔끔한 데이터셋을 만들어 이를 결합, 그룹화, 병합, 분할 등 데이터 분석의 기초를 설명

ㆍ 정규화, 조인, 그룹화 등 SQL 개념을 이용하여 데이터를 다루는 방법을 소개

ㆍ 맷플롯립, 시본 등을 활용하여 데이터 시각화의 기본인 그래프를 그리는 방법을 안내

ㆍ 빌보드 차트, 에볼라 및 인플루엔자 데이터셋, 날씨 데이터셋, 은행 정보 데이터셋, 주식 데이터셋 등 현실 데이터를 활용한 판다스 예제로 실습 구성

수많은 파이썬 라이브러리 가운데 ‘판다스’를 왜 알아야 할까?

데이터 분석 전문가로 가는 출발점에 판다스가 있습니다!

파이썬은 데이터 분석 분야에서 가장 많이 활용되고 있습니다. 판다스는 데이터 분석 라이브러리 가운데 활용도가 가장 높은 파이썬 라이브러리입니다. 데이터 분석과 관련한 다른 파이썬 라이브러리가 계속 생겨나지만 거의 대부분 판다스에 의존하고 있으니 판다스는 기본 상식처럼 알아 두어야 합니다. 이러한 판다스를 대체할 도구는 당분간 찾기 어려울 것입니다.

R? 파이썬? 엑셀? 대체 뭘로 데이터 분석을 시작해야 돼?

판다스에 입문해 이 고민을 해결해 보세요!

R의 장점을 파이썬으로 가지고 올 수 있었던 것은 바로 판다스 덕분입니다. R에서 파이썬으로 분석 방법을 바꾸고 싶다면 판다스를 시작하세요! 또한 공공기관, 연구기관에서 사용하는 CSV, TSV 등 대량의 데이터 파일을 판다스로 다룰 수 있어 실무에서 의사결정을 할 때 기초 자료를 만드는 데 도움이 될 것입니다. 그동안 엑셀에서 규모가 큰 데이터를 분석할 때 컴퓨터가 버벅거린 경험이 있다면 파이썬 문법을 거의 몰라도 괜찮으니 이 책으로 판다스에 입문해 보세요. 이 책으로 공부하면 데이터 분석을 정말 쉽게 시작할 수 있습니다.

독학 교재로도, 스터디 교재로도 강추!

매일 2시간씩, 10일 공부해 판다스 기초를 정복해 보세요!

이 책으로 2시간씩 10일을 공부하면 파이썬을 거의 몰라도 판다스의 기초를 마스터할 수 있습니다. 특히 이 책은 원서에 없는 아나콘다, 주피터 노트북, pip과 같은 판다스 실습 환경을 구성하는 준비 과정을 따라 하기 쉽게 친절히 설명했습니다. 또한 날씨 관측 데이터, 주식 데이터, 빌보드 차트 등 다양한 데이터를 이용해 데이터 분석 작업 단위로 나눠 실습을 진행하므로 초보자도 겁먹지 않고 예제를 따라 할 수 있도록 구성했습니다. 파이썬이나 데이터 분석을 잘 안다면 5일 만에도 이 책을 정복할 수 있으니 도전해 보세요!

한 가지 더! 저자가 꼼꼼히 남긴 공식 문서를 꼭 활용하여 학습해 보세요

이 책 전반에 걸쳐 판다스 실습과 관련된 다양한 공식 문서 링크를 꼼꼼히 남겼습니다. 학습하다 궁금한 점이 있거나 판다스 함수나 메서드 등 자세한 내용을 알고 싶을 땐 반드시 이 링크를 따라 공식 문서를 확인해 보세요. 이 책과 공식 문서를 통해 판다스의 기본기를 갖추고 나서 데이터 분석 전문서나 강의에 도전한다면 데이터 분석 전문가로 거듭날 수 있어요!

그럼 이상으로 Do it! 데이터 분석을 위한 판다스 입문 책소개 포스팅을 마치겠습니다.

Do it! 데이터 분석을 위한 판다스 입문 책소개 포스팅은 제휴마케팅이 포함되어있습니다.

 

#데이터분석, #판다스, #pandas, #입문, #책소개, #책추천, #강의, #강좌

+ Recent posts