데이터 분석을 위한 

판다스 입문책을 소개해드릴게요.

https://app.ac/GqprMp283

 

Do it! 데이터 분석을 위한 판다스 입문 | 다니엘 첸 - 교보문고

Do it! 데이터 분석을 위한 판다스 입문 |

product.kyobobook.co.kr

파이썬 기초 문법만 알아도 OK!

테슬라 주식, 빌보드 차트 등 16개의 현실 데이터와 115개의 예제로 판다스의 기본을 확실히 익히자!

이미 1만여 명의 독자가 선택한 《Do it! 데이터 분석을 위한 판다스》가 파이썬 3.11.X 버전과 판다스 2.X 버전에 맞춰 개정하였다. 기존 판보다 100쪽 이상 증보되어 더 자세하고 친절하다. 파이썬 기초를 뗐다면 이 책으로 판다스를 공부하기 어렵지 않다. 이 책은 판다스의 주요 용어, 원리와 개념은 물론, 넘파이, 맷플롯립이나 시본, 시계열 데이터 등 파이썬 데이터 분석의 기본기를 익힐 수 있다. 이와 더불어 과학, 경제, 종교, 엔터테인먼트, 의학, 사회 등 다양한 분야의 현실 데이터셋을 활용한 판다스와 데이터 분석 실습 예제 115개로 실무 감각을 키울 수 있다는 점도 특징이다.

작가정보

저자(글) 다니엘 첸

인물정보

프로그래머

(Daniel Y. Chen)

2013년부터 소프트웨어 카펜트리(Software Carpentry)에서 지금까지 데이터 분석 강사와 멘토링 활동을 하고 있습니다. 그뿐만 아니라 2016년부터는 매년 국제 파이썬 커뮤니티인 사이파이(SciPy)에서 판다스 강의를 진행하고 있습니다.

인물정보

번역가/통역사>영어 프로그래머

자연어 처리 연구를 진행하며 챗봇을 개발하는 평범한 개발자입니다. 새로운 분야나 지식을 접하고 공부하기를 좋아하고 학습과 지식 공유를 목표로 번역 활동을 하고 있습니다. 지금까지 《행동 데이터 분석》, 《판다스 인 액션》, 《자바 코딩 인터뷰 완벽 가이드》, 《엑셀, R, 파이썬으로 시작하는 데이터 분석》 등을 번역했습니다.

목차

01 판다스 실습 환경 준비하기

__01-1 아나콘다 설치하기

__01-2 판다스 실습 준비하기

__01-3 안녕? 주피터 노트북!

__01-4 파이썬 패키지 관리자 pip 알아보기

02 판다스 시작하기

__02-1 판다스가 왜 필요할까?

______ 데이터프레임과 시리즈

__02-2 데이터셋 불러오기

______ 데이터 분석은 데이터셋 불러오기부터

__02-3 데이터 추출하기

______ 열 데이터 추출하기

______ 행 데이터 추출하기

______ loc와 iloc로 데이터 추출하기

______ 행과 열 함께 지정하여 추출하기

__02-4 기초 통계 계산하기

______ 그룹화한 데이터의 평균 구하기

______ 그룹화한 데이터 개수 세기

__02-5 데이터를 그래프로 표현하려면?

03 판다스 자료구조 살펴보기

__03-1 나만의 데이터 만들기

______ 시리즈와 데이터프레임 만들기

__03-2 시리즈 다루기

______ 시리즈의 keys() 메서드

______ 시리즈와 ndarray

______ 시리즈와 불리언

______ 시리즈와 브로드캐스팅

__03-3 데이터프레임 다루기

______ 데이터프레임의 구성

______ 데이터프레임과 불리언 추출

______ 데이터프레임과 브로드캐스팅

__03-4 시리즈와 데이터프레임 데이터 변환하기

__03-5 데이터 저장하고 불러오기

______ 피클로 저장하고 불러오기

______ CSV와 TSV 파일로 저장하고 불러오기

______ 엑셀로 저장하기

______ 다양한 형식으로 저장하기

______ 다양한 데이터 저장 유형

04 그래프 그리기

__04-1 데이터 시각화란?

__04-2 matplotlib 라이브러리란?

______ 그림 영역과 하위 그래프 이해하기

______ 그래프 구성 요소 이해하기

__04-3 matplotlib으로 그래프 그리기

______ 일변량 그래프 그리기

______ 이변량 그래프 그리기

______ 다변량 그래프 그리기

__04-4 seaborn으로 그래프 그리기

______ 다양한 그래프 그려 보기

______ seaborn 스타일 알아보기

______ seaborn 공식 문서 읽는 방법

__04-5 판다스로 그래프 그리기

05 깔끔한 데이터 만들기

__05-1 깔끔한 데이터란?

__05-2 열 이름이 값일 때

______ 하나의 열만 남기기

______ 여러 개의 열 남기기

__05-3 열 이름에 변수가 여러 개일 때

______ 열 이름이 여러 가지 뜻일 때

______ 열 이름 분할하고 새로운 열로 할당하기

______ 한 번에 분할하고 합치기

__05-4 변수가 행과 열 모두에 있을 때

06 apply() 메서드로 함수 적용하기

__06-1 간단한 함수 만들기

__06-2 apply() 메서드 사용하기

______ 시리즈에 함수 적용하기

______ 데이터프레임에 함수 적용하기

__06-3 람다 함수 사용하기

__06-4 벡터화된 함수 사용하기

______ 넘파이와 넘바로 벡터화하기

07 데이터 결합하고 분해하기

__07-1 데이터 묶어 분석하기

__07-2 데이터 연결하기

______ 데이터프레임 살펴보기

______ 행 연결하기

______ 열 연결하기

______ 인덱스나 열 이름이 다른 데이터 연결하기

__07-3 분할된 데이터 연결하기

__07-4 여러 데이터셋 병합하기

__07-5 데이터 정규화하기

08 그룹으로 묶어 연산하기

__08-1 데이터 집계하기

______ groupby() 메서드와 함께 사용하는 집계 메서드

______ agg() 메서드와 groupby() 메서드 조합하기

______ 여러 개의 집계 함수 한 번에 사용하기

__08-2 데이터 변환하기

______ 표준점수 계산하기

______ 평균값으로 결측값 채우기

__08-3 원하는 데이터 걸러 내기

__08-4 그룹 객체 활용하기

______ 그룹 객체란?

__08-5 다중 인덱스 다루기

09 결측값 알아보기

__09-1 결측값이란?

__09-2 결측값은 왜 생길까?

______ 데이터를 불러올 때 생기는 결측값

______ 데이터를 연결할 때 생기는 결측값

______ 직접 입력한 결측값

______ 인덱스를 다시 설정할 때 생기는 결측값

__09-3 결측값 다루기

______ 결측값 처리하기

______ 결측값이 있는 데이터 계산하기

__09-4 판다스 내장 NA 결측값 살펴보기

10 자료형 더 알아보기

__10-1 자료형 살펴보기

__10-2 자료형 변환하기

__10-3 범주형 데이터 알아보기

______ 범주형 데이터 다루기

11 문자열 처리하기

__11-1 문자열 다루기

______ 인덱스로 문자열 추출하기

______ 슬라이싱 구문으로 마지막 문자 추출하기

__11-2 자주 사용하는 문자열 메서드

__11-3 문자열 메서드 더 알아보기

__11-4 문자열 포매팅 알아보기

__11-5 정규식으로 문자열 처리에 날개 달기

______ 정규식이란?

______ compile() 함수

__11-6 regex 라이브러리 활용하기

12 시계열 데이터 알아보기

__12-1 datetime 객체 활용하기

__12-2 datetime으로 변환하기

__12-3 시계열 데이터 불러오기

__12-4 시간 정보 추출하기

__12-5 시간 간격 계산하기

__12-6 datetime 객체의 메서드 활용하기

__12-7 주식 데이터 다루기

__12-8 시간별 데이터 추출하기

__12-9 시간 범위 다루기

______ 시간 범위의 주기 설정하기

__12-10 열 방향으로 값 옮기기

__12-11 시간 주기 변경하기

__12-12 시간대 다루기

__12-13 시계열 데이터 다루는 방법 더 알아보기

찾아보기

출판사 서평

이 책의 주요 내용

ㆍ 판다스로 깔끔한 데이터셋을 만들어 이를 결합, 그룹화, 병합, 분할 등 데이터 분석의 기초를 설명

ㆍ 정규화, 조인, 그룹화 등 SQL 개념을 이용하여 데이터를 다루는 방법을 소개

ㆍ 맷플롯립, 시본 등을 활용하여 데이터 시각화의 기본인 그래프를 그리는 방법을 안내

ㆍ 빌보드 차트, 에볼라 및 인플루엔자 데이터셋, 날씨 데이터셋, 은행 정보 데이터셋, 주식 데이터셋 등 현실 데이터를 활용한 판다스 예제로 실습 구성

수많은 파이썬 라이브러리 가운데 ‘판다스’를 왜 알아야 할까?

데이터 분석 전문가로 가는 출발점에 판다스가 있습니다!

파이썬은 데이터 분석 분야에서 가장 많이 활용되고 있습니다. 판다스는 데이터 분석 라이브러리 가운데 활용도가 가장 높은 파이썬 라이브러리입니다. 데이터 분석과 관련한 다른 파이썬 라이브러리가 계속 생겨나지만 거의 대부분 판다스에 의존하고 있으니 판다스는 기본 상식처럼 알아 두어야 합니다. 이러한 판다스를 대체할 도구는 당분간 찾기 어려울 것입니다.

R? 파이썬? 엑셀? 대체 뭘로 데이터 분석을 시작해야 돼?

판다스에 입문해 이 고민을 해결해 보세요!

R의 장점을 파이썬으로 가지고 올 수 있었던 것은 바로 판다스 덕분입니다. R에서 파이썬으로 분석 방법을 바꾸고 싶다면 판다스를 시작하세요! 또한 공공기관, 연구기관에서 사용하는 CSV, TSV 등 대량의 데이터 파일을 판다스로 다룰 수 있어 실무에서 의사결정을 할 때 기초 자료를 만드는 데 도움이 될 것입니다. 그동안 엑셀에서 규모가 큰 데이터를 분석할 때 컴퓨터가 버벅거린 경험이 있다면 파이썬 문법을 거의 몰라도 괜찮으니 이 책으로 판다스에 입문해 보세요. 이 책으로 공부하면 데이터 분석을 정말 쉽게 시작할 수 있습니다.

독학 교재로도, 스터디 교재로도 강추!

매일 2시간씩, 10일 공부해 판다스 기초를 정복해 보세요!

이 책으로 2시간씩 10일을 공부하면 파이썬을 거의 몰라도 판다스의 기초를 마스터할 수 있습니다. 특히 이 책은 원서에 없는 아나콘다, 주피터 노트북, pip과 같은 판다스 실습 환경을 구성하는 준비 과정을 따라 하기 쉽게 친절히 설명했습니다. 또한 날씨 관측 데이터, 주식 데이터, 빌보드 차트 등 다양한 데이터를 이용해 데이터 분석 작업 단위로 나눠 실습을 진행하므로 초보자도 겁먹지 않고 예제를 따라 할 수 있도록 구성했습니다. 파이썬이나 데이터 분석을 잘 안다면 5일 만에도 이 책을 정복할 수 있으니 도전해 보세요!

한 가지 더! 저자가 꼼꼼히 남긴 공식 문서를 꼭 활용하여 학습해 보세요

이 책 전반에 걸쳐 판다스 실습과 관련된 다양한 공식 문서 링크를 꼼꼼히 남겼습니다. 학습하다 궁금한 점이 있거나 판다스 함수나 메서드 등 자세한 내용을 알고 싶을 땐 반드시 이 링크를 따라 공식 문서를 확인해 보세요. 이 책과 공식 문서를 통해 판다스의 기본기를 갖추고 나서 데이터 분석 전문서나 강의에 도전한다면 데이터 분석 전문가로 거듭날 수 있어요!

그럼 이상으로 Do it! 데이터 분석을 위한 판다스 입문 책소개 포스팅을 마치겠습니다.

Do it! 데이터 분석을 위한 판다스 입문 책소개 포스팅은 제휴마케팅이 포함되어있습니다.

 

#데이터분석, #판다스, #pandas, #입문, #책소개, #책추천, #강의, #강좌

+ Recent posts