파이썬 기초를 배우고 이후 무언가 해보고 싶은데 막막하던차에 이 책을 만나게 되었습니다.
우선 그림이 많아 내용이 딱딱하지 않고 해당 프로그램을 돌릴때 사용가능한 컴퓨터 버전들까지 디테일하게 알려주고 또한 프로그램 설치시 눌러야 되는 버튼 하나도 일일이 표시를 해줘서 따라하며 배우기에는 아주 친절한 책입니다. 자칫 어렵고 딱딱할수있는 내용인데 귀여운 캐릭터가 나와서 만화책 같이 재미있게 볼수있어서 좋았습니다. 파이썬이 익숙하지 않은 성인에게도 학생들에게도 무리없이 따라할수있게 되어있어서 다른 파이썬 1학년과 자바스크립트1학년 자바1학년도 구매를 해보고싶다는 생각이 들었습니다.
#성안당 #Python #파이썬 #Python2학년스크래핑의구조 #스크래핑의구조
1. 좋은 글귀, 마음에 드는 가사 인상 깊은 영화 대사 등을 메모해 주세요. |
2. 출처를 넣어주세요. ex) 234page, 4번 트랙<사랑해>, <브리짓존스의 다이어리>에서 브리짓의 대사 |
본인은 현재 기초 파이썬 수업을 듣고 있는데, 이제 수강 기간이 끝나면 지금 배운 것도 다 까먹을 것 같았다. 그래서 학원을 가자니 시간이 안 나서 책이라도 살까 했다.
그런데 내가 찾아본 파이썬 기초 책들은 텍스트가 빼곡해서 첫장을 넘기는 데서 부터 압박감이 심했다. 그러던 차에 이 책을 알게 되어 서평 이벤트를 신청하여 보게 되었는데
와.
나 학원 안 가도 되겠다!
싶었다. 물론 심화 과정을 배우려면 가야겠지만 기초 과정을 되새김하기 위해서 굳이 학원에 갈 필요는 없겠다는 소리다. (참고로 진짜 생기초는 1학년 편에서 나오며 난 이 책이 마음에 들어 1학년 책도 개인적으로 구매했음.)
이 책의 장점은 글자의 크기가 적당하고 만화 및 삽화, 실습 이미지가 적절히 들어가 있다는 점이다. 정말 기초를 알려주는 책이라고 해서 샀더니 빼곡한 텍스트에 압도당해 앞페이지만 조금 읽고 중고서점에 팔았던 경험이 있는 분들께 추천한다.
보이시나요~~~삽화 텍스트 글자크기 예시 배치가 정말 이렇게 딱 적절함~~~~~
어쩌면 난 무료 강의를 통해 이미 파이썬 기초 강의를 들었기 때문에 어느 정도 용어가 익숙해서 더 쉽게 읽었을 수도 있다.
개인적으로 나에게 도움이 되었던 파트는 판다스 파트였다. 강의에서 한번 듣고 이 책의 예제를 한 번 더 보니 판다스의 개념을 이해하는데 많은 도움을 받았다.
그리고 5장의 웹 api 데이터 수집도 차근차근 따라 해보니 파이썬이 전보다 더 친숙해진 것 같았다.
물론 난 아직도 코드를 다 외우지 못 해서 으으??거리는 대왕초보이나 앞으로 파이썬 배우며 기억이 나지 않는 부분이나 막히는 부분이 생길때 이 책이 좋은 조력자 노릇을 톡톡히 해줄 것 같다. 그리고 파이썬 심화과정을 배우기 전의 기초 토대를 쌓는 데도 도움을 줄 것 같고 말이다.
작법서 외에 이런 실용서를 본 것은 정말 오랜만인데 매우 만족스러웠다. 3학년이 나오면 사지 않을까 싶다!
“YES24 리뷰어클럽 서평단 자격으로 작성한 리뷰입니다.”
코딩이 붐을 이루고 있습니다. 초등학생들이 배울 과목은 더 이상 국영수과가 아닌, 국영수코라는 말도 있었지요. 코딩이 왜 필요한가를 생각해보자니, 코딩이 삶을 풍요롭게 해 주는 수단이 되기 때문인 것 같습니다.
인터넷이 확산되고, 그만큼 사람들에게 유용한 자료의 양이 늘어났습니다. 이제는 단순히 많다라고 말할 수는 없을 정도입니다. 이 많은 자료 중에 내게 필요한 자료를 어떻게 자동으로 수집하고 정리할 것인지를 고민해야 할 때지요. 이 책, <Phython 2학년 스크래핑의 구조>는 그 고민을 명확하게 해결해줍니다. 넷상에서 구할 수 있는 정보들을 크롤링 (인터넷에서 공개된 데이터를 수집하는 일, p15)하고, 스크래핑 (수집한 데이터를 해석해 필요한 데이터를 구하는 일, p15)하는 과정을 어떻게 python으로 구현하느냐가 이 책의 가장 큰 목적인 셈입니다.
그렇다면 제일 먼저 해야 할 일은 프로그램 언어인 python을 다운로드 받는 것입니다. 제1장에서는 먼저 파이썬을 설치하고, 파이썬으로 데이터를 다운로드하는 방법을 알려줍니다. 또한, 인터넷 상에서 받은 텍스트 파일(일반 문서)을 읽고 쓰는 방법도 상세히 설명해줍니다. 물론, 깔끔한 그림과 예시문과 함께 말입니다.
이렇게 파이썬을 설치한 다음에, 2장에서는 HTML을 해석하는 과정을 설명합니다. 아시다시피, HTML은 많은 태그로 작성됩니다. </br>은 한 줄을 바꾸는 식으로 말이죠. 이런 태그를 구분해서 내게 필요한 데이터를 추출하기 위해서, 먼저 beautiful soup을 설치합니다. 이 라이브러리를 이용해서 html 소스의 내부 요소를 검색하는 과정이 2장에서 소개됩니다.
3장에서는 pandas를 이용한 표 데이터 읽기 쓰기 과정을 보여줍니다. pandas 역시 2장의 beautiful soup처럼 일정한 기능을 하기 위한 외부 라이브러리이죠. 이를 이용해서 표를 읽고, 자료를 추가/삭제하거나 다시 정렬하는 등 자료를 가공하는 과정을 보여주지요. 가공된 자료를 csv 파일이나 그래프, 이미지나 엑셀 파일로 저장하는 단계까지 설명합니다. 마지막 단계에서는 엑셀 파일을 어떻게 활용하는지에 대해서도 알려줍니다.
4장에서는 공개되어 있는, 오픈 데이터를 읽어 들여서 활용하는 방법을 설명합니다. 우체국의 우편번호 데이터, e-나라지표의 국정 모니터링지표, 기상자료개방포털의 기상청 날씨 데이터 서비스, 공공데이터포털의 지방자치단체 데이터를 활용할 수 있도록 상세하게 알려줍니다. 이를 응용해서 그 외의 오픈 데이터를 활용할 수 있다면, 필요한 자료를 크롤링하고 스크래핑하는 과정이 조금 더 효율적일 것입니다.
5장에서는 웹 API (웹에서 다른 컴퓨터의 기능을 HTTP를 사용해 이용할 수 있게 해주는 장치, p159)를 활용하는 방법을 소개합니다. 이 방법은 자주 갱신되는 자료, 즉 날씨나 주가 등 변동이 잦은 자료를 활용할 때 유용하겠지요. 활용할 수 있도록 소개된 자료들은 OpenWeatherMap을 이용한 현재 날씨 조사하기, 오늘부터 5일간 세 시간 간격의 날씨 알아보기가 소개됩니다.
정보의 홍수 속에서 내게 필요한 정보를 찾아서 정리해서 쓴다는 것은 정말 매력적이지요. 그런 매력적인 작업을 하나씩 세세하고도 재미있게 설명해 놓은 책, <파이썬 2학년 스크래핑의 구조>는 작업에 매력을 더해줍니다. 이 책을 통해 필요한 자료를 어디서든 손쉽게 찾아서 유용하게 활용하시기를 바랍니다.
YES24 리뷰어클럽 서평단 자격으로 작성한 리뷰입니다.