본문 바로가기

AI/Data Engineer

(3)
Web crawling 웹 크롤링(Web crawling) 웹 크롤링은 웹상에 존재하는 정보를 수집하는 작업을 말한다. 네이버 영화 크롤링 import re import requests from bs4 import BeautifulSoup BASE_URL = "https://movie.naver.com/movie" def get_page(page_url): page = requests.get(page_url) soup = BeautifulSoup(page.text) return soup, page 영화 별점 평균 내기 def get_avg_stars(reviews): score = 0 for review in reviews: score += review['review_star'] avg = score / len(reviews)..
database : SQL !수정중 SQL? SQL은 관계형 데이터베이스 관리 시스템(RDBMS)의 데이터를 관리하기 위해 설계된 특수 목적의 프로그래밍 언어이다. 관계형 데이터베이스 관리 시스템에서 자료의 검색과 관리, 데이터베이스 스키마 생성과 수정, 데이터베이스 객체 접근 조정 관리를 위해 고안되었다. 많은 수의 데이터베이스 관련 프로그램들이 SQL을 표준으로 채택하고 있다. 위키백과 -> 대량의 정보를 컴퓨터가 효율적으로 접근할 수 있도록 가공 및 저장하는 것. DBMS를 사용함으로써 여러 사람이 데이터를 공유할 수 있고, 대량의 데이터를 다룰 수 있다. relational database? 관계형 데이터베이스는 테이블로 이루어져 있으며, key와 value로 관계를 나타낸다. 테이블 간의 관계는 3개로 나뉜다. 1. 일대..
docker docker? 도커 컨테이너는 일종의 소프트웨어를 소프트웨어의 실행에 필요한 모든 것을 포함하는 완전한 파일 시스템 안에 감싼다. 여기에는 코드, 런타임, 시스템 도구, 시스템 라이브러리 등 서버에 설치되는 무엇이든 아우른다. 이는 실행 중인 환경에 관계 없이 언제나 동일하게 실행될 것을 보증한다. 위키백과 도커는 리눅스 컨테이너를 기반으로 특정 소프트웨어를 실행하기 위해 필요한 서비스를 패키징하고 배포하기 위해 사용하는 프로그램이다. 하나의 프로그램을 작업하기 위해 여러 사람이 협업을 한다 가정하면, 모든 사람의 컴퓨터 환경을 맞추는 것은 쉽지 않은 일이기 때문에 docker 컨테이너를 활용하여 어느 컴퓨터에서든 해당 프로그램이 구동할 수 있도록 하기 위해서 사용한다. 도커 컨테이너를 통해 개발되는 프..