엑셀 데이터 다루기 jexcel(JXL) 라이브러리 다운로드 JAVA 에서 Excel 파일을 다루기 위해서는 일반적으로 JXL 라이브러리를 활용한다. jexcel api 다운로드 해당 API 의 Excel 지원 버전은 2003 이지만 여전히 많이 쓰이는 API 이다. (또는 POI 라이브러리를 활용할 수도 있다.) 프로젝트에 JXL 추가하기 다운로드 받은 jar 파일을 프로젝트에 추가한다. intellij, ecelipse 에서 프로젝트에 jar 라이브러리를 추가하는 방법은 다음 링크를 참고한다. Eclipse에서 프로젝트에 외부 jar 추가하기 IntelliJ에서 프로젝트에 외부 jar 추가하기 JXL 엑셀파일 제어 기초 github 소스코드 보기 JXL 기본 조작 예제 엑셀파일 생성 Sheet 생성 ..
리뷰 수집 크롤러 JAVA 의 파일입출력기능(스트림)과 jsoup 라이브러리를 활용하여 리뷰를 수집하는 크롤러를 작성해보자. package com.company; import java.io.FileWriter; import java.io.IOException; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.select.Elements; public class Main { public static void main(String[] args) { try { //1.Url 접근 Document doc = Jsoup.connect("http://movie.naver.com/movie/bi/mi/point.nhn?code=161..
빅데이터와 크롤링 크롤링은 빅데이터를 수집하는 기술로서 의의가 있다. 따라서 먼저 빅데이터에 관련하여 간단히 알아보자. 빅데이터 빅데이터 관련 복습 -> 수집 방법 공부 -> 웹 크롤링 Q. 하루에 생성되는 데이터의 양은 ? 250경 바이트, 300억 페이스북 메시지, 10억 트윗 (2018년 기준) 빅데이터 3V, 4V, 5V 빅데이터의 3가지 특징 Volume Velocity Variety (여기까진 과거, 최근에는 4V, 5V 개념까지 확장, 이것도 2018년 기준) Vearcity[və|rӕsəti]: 정확성, 진실성 Value : 가치 빅데이터 처리 절차 빅데이터의 처리가 이루어지는 과정 (Big Data Processing Flow) 수집(Web page, sensor) 저장(Server, D..