본문 바로가기
R 주제/크롤링

[R 크롤링] 10. R크롤링 함수 모음

by 만다린망고 2021. 4. 7.
반응형

1-1. HTML 가져오기 (GET 방식)

#라이브러리 불러오기
library(httr)
library(rvest)

#GET 함수로 서버에 정보 요청하기
url = '주소'
get_url = GET(url)

#read_html 함수로 html 코드 읽기
my_html=read_html(get_url,encoding='utf-8')

 

1-2. HTML 가져오기 (POST 방식)

#라이브러리 불러오기
library(httr)
library(rvest)

#GET 함수로 서버에 정보 요청하기
url = '주소'
get_url = POST(url, body = 
              list(
                method = ' ',
                ...
              ))

#read_html 함수로 html 코드 읽기
my_html=read_html(get_url,encoding='utf-8')

 

2. 추출하기

#태그 추출
html_nodes(my_html,'태그 이름')
html_nodes(my_html,'부모 태그 이름>자식 태그이름')

#id추출
html_nodes(my_html,'#id이름')

#클래스 추출
html_nodes(my_html,'.클래스 이름')

#title추출
html_nodes(my_html,'*[title='이름']')

#title 전부 추출
html_attr('title')

#텍스트 추출
html_text(my_html,trim=TRUE)
반응형

댓글