본문 바로가기
Data Analysis/Data Analysis

Kaggle API

by SeleniumBindingProtein 2022. 4. 27.
728x90
반응형
  • 캐글(Kaggle) 사이트로 이동하여 가입을 하고, API 토큰 발급을 받아야 함
    • 가입은 구글 아이디로 연동하면 쉽게 되며, 로그인을 하면 우측 상단의 이미지를 클릭하면 Your Profile 에 들어갈 수 있는데, Account를 누르고 스크롤 다운하면 API 섹션이 보이고, Create New API Token을 클릭하면 kaggle.json 파일이 다운로드 됨
    • kaggle.json파일은 메모장으로 열어보면 username과 key값이 있고, user name은 말그대로 내 캐글의 이름이고, key값은 비밀번호이니 다른 곳에 공개해서는 안됨 (만약 유출되었거나 다른 이유로 key값을 바꾸고 싶다면, 아까 Create New API Token 버튼 옆에 있는 Expire API Token을 클릭하고 재생성 하면 된다.)
  • 로컬 PC에서 캐글 API 연동하기
    • 윈도우즈 파워쉘(Windows PowerShell)이나 아나콘다 프롬프트(Anaconda Prompt)와 같은 터미널을 열어서 캐글을 설치해야 함
    • conda install -c conda-forge kaggle
    • 이렇게 명령어를 치면, 설명이 나오고, y를 입력하여 설치 완료
    • 이후, 터미널에 kaggle 치면 그 위치에 폴더가 생성이 되어 있고, 맨 처음 받아둔 kaggle.json을 이 폴더에 옮기면 됨
  • 구글 코랩에서 캐글 API 연동하기
    • 라이브를 연동하고 import os를 한 뒤 kaggle.json 안에 있는 username과 key값을 넣으면 됨
import os
os.environ['KAGGLE_USERNAME'] = 'kaggle.json에 있는 username값을 넣는다'
os.environ['KAGGLE_KEY'] = 'kaggle.json에 있는 key값을 넣는다'
# 잘 연동되었는지 확인하기
!kaggle -h
  • 캐글 API를 이용한 데이터 다운로드
    • Datasets에서 원하는 데이터를 찾아 클릭하고, 우측의 더보기를 클릭하면 Copy API commend가 있어서 클릭하면 자동으로 복사가 되며, 복사된 명령어를 그대로 구글 코랩 또는 터미널에 붙여 넣으면 끝!!
  • Kaggle API  깃허브 
 

GitHub - Kaggle/kaggle-api: Official Kaggle API

Official Kaggle API. Contribute to Kaggle/kaggle-api development by creating an account on GitHub.

github.com

 

728x90
반응형

댓글