새소식

반응형
Python/자동화

(파이썬 웹크롤링) 네이버 뉴스 크롤링

  • -
반응형

파이썬으로 네이버에 검색된 최신 뉴스를 크롤링 해봅시다.

여러분은 매일 확인하는 뉴스가 있나요? 특히 검색해서 확인하는 키워드가 있다면 이번 포스팅은 정말 큰 도움이 될것입니다. 

 

코드부터 바로 볼게요!

반응형
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By
import time

# step1. 검색할 키워드 입력
query = input('검색 키워드 입력:')
time.sleep(5)

# step2. 크롬드라이버로 원하는 url 접속
url = 'https://www.naver.com'
driver = webdriver.Chrome()
driver.get(url)
time.sleep(0.5)

# Step3. naver 검색창에 키워드 입력 후 Enter
search = driver.find_element(By.ID, 'query')
search.send_keys(query)  # 검색 키워드 입력
search.send_keys(Keys.RETURN)  # Enter

# step4. 뉴스 탭 클릭
all_news = driver.find_elements(By.CLASS_NAME, 'news_tit')

for news in all_news:
    print(news.text)
    print(news.get_attribute('href'))

driver.quit()

 

 

위의 스크립트를 실행하면 검색 키워드를 입력하라고 뜹니다. 현재 모태솔로 특집으로 핫한 나는솔로를 입력해 보았습니다.

input keyword

 

짜잔! 검색어를 입력하면 뉴스 제목과 뉴스 url이 출력됩니다. 

news crawling result

 

위의 코드를 잘 활용하면 매일 원하는 뉴스를 크롤링해서 쉽게 볼 수 있도록 자동화가 가능해집니다!

 

2024.3.21 정상 작동 확인

used python package list

사용한 package list 입니다.

반응형
Contents

포스팅 주소를 복사했습니다

이 글이 도움이 되었다면 공감 부탁드립니다.