once upon a time_

  • 홈

데이터마이닝 1

[파이썬 웹크롤링] 웹 크롤링&텍스트마이닝 1일차

나무위키 최근 변경 사이트인 "https://namu.wiki/RecentChanges"를 크롤링 해 보자. 크롤링을 진행하기에 앞서 필요한 라이브러리 설치. request 모듈 : python에서 HTTP 요청을 보내는 모듈 BeautifulSoup 모듈 : 웹페이지 HTML 문서를 파싱하기 위한 모듈(모듈명은 bs4) anaconda prompt창(관리자 권한으로 실행)에 - pip install requests beautifulsoup4 lxml 을 입력해 라이브러리 설치! (pandas는 이미 설치 되어 있어서 하지 않았다.) 먼저 크롤링할 주소를 정의하고, requests 라이브러리에 있는 메소드인 get으로 parameter을 보낸 후, content 속성을 이용해서 response data를..

프로그래밍/웹크롤링 & 텍스트마이닝 2020.08.09
이전
1
다음
더보기
프로필사진

once upon a time_

Larkspur

  • 분류 전체보기
    • 프로그래밍
      • 웹크롤링 & 텍스트마이닝
      • 머신러닝&딥러닝
      • OpenCV
    • 일상^&^

Tag

Python, 강의 체크 속지, 파이썬, 초심찾아지오나, 지능기전공학부, 데이터전처리, OpenCV, 인스타그램 크롤링, 일상, 스터디, 영상처리, 데이터분석, 아이패드 속지 무료 공유, 아이패드 속지, 웹크롤링, 텍스트마이닝, 인공지능, 파이썬 데이터, 빅데이터, selenium,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/07   »
일 월 화 수 목 금 토
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바