플젝기록/졸업 프로젝트

colab에서 이미지 크롤링하기

팽팽 2022. 4. 21. 12:48

1. colab 들어가서 다운로드 받기

!git clone https://github.com/mtinet/googleImageDownloader

2. urls.txt 다운로드 받기

1) 구글에 다운로드 받고 싶은 이미지 키워드 검색

2) 원하는 만큼 스크롤

3) colab들어가서 googleImageDownloader 의 js_console.js의 내용복사

4) ctrl + shift + i 눌러서 개발자 도구 열고 console창에 js_console.js 내용 붙여넣고 엔터누르면 자동으로 다운됨

 

3. 코랩에 들어가서 해당 디렉토리의 urls.txt내용을 다운받은 urls.txt의 내용으로 바꿔준다.

 

4. 다운받을 폴더를 새로 생성하고, 그 폴더로 경로 이동 후 다운받으면 끝!

%cd googleImageDownloader
!python download_images.py -u urls.txt -o "/content/drive/MyDrive/download/milkis"

 

완료.

 

출처: sssbin님의 티스토리

https://sssbin.tistory.com/174

 

구글에서 크롤링해서 사진 저장 (colab) + 네이버 추가

https://github.com/mtinet/googleImageDownloader GitHub - mtinet/googleImageDownloader Contribute to mtinet/googleImageDownloader development by creating an account on GitHub. github.com 1. colab ->..

sssbin.tistory.com