기억을 지배하는 기록

Notice

Recent Posts

Recent Comments

Link

« 2025/02 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

Tags more

Archives

Today

Total

관리 메뉴

목록전체 글 (929)

728x90

기억을 지배하는 기록

자바에서 파이썬 코드 호출하기

자바에서 파이썬 코드를 호출하는 것은 몇 가지 방법을 통해 가능합니다. 여기에 가장 흔하게 사용되는 두 가지 방법을 소개하겠습니다. 1. Jython 사용하기Jython은 자바 플랫폼에서 파이썬 코드를 실행할 수 있게 해주는 인터프리터입니다. Jython을 사용하면 자바 프로그램 내에서 직접 파이썬 코드를 실행할 수 있습니다. 설치 방법:Jython 공식 웹사이트에서 Jython Jar 파일을 다운로드합니다.자바 프로젝트에 Jython Jar 파일을 추가합니다.예제 코드:import org.python.util.PythonInterpreter;public class JythonExample { public static void main(String[] args) { PythonInter..

Kotlin for Beginners 2024. 4. 26. 10:24

Java ProcessBuilder와 Process API

ProcessBuilder와 Process 클래스는 자바에서 외부 프로세스를 실행하고 관리하기 위해 사용됩니다. 이 클래스들을 사용하면 자바 코드 내에서 다른 애플리케이션을 실행하고, 그 입력과 출력을 관리할 수 있습니다. 아래에서는 ProcessBuilder와 Process 클래스의 주요 기능과 메소드들을 상세히 설명하겠습니다. ProcessBuilder 클래스ProcessBuilder 클래스는 프로세스의 실행 환경을 설정하는 데 사용됩니다. 이 클래스의 인스턴스는 실행할 프로그램과 그 인자들을 설정하고, 프로세스의 환경 변수와 작업 디렉토리를 구성할 수 있습니다. 주요 생성자와 메소드생성자ProcessBuilder(String... command): 실행할 명령과 그 인자들을 받습니다.ProcessB..

Library 2024. 4. 26. 10:02

Python 사용자 인증 (JWT) 받기

웹 API에 Authorization 헤더를 추가하여 JWT (JSON Web Token)를 사용한 인증 방법을 사용할 때는 requests 라이브러리의 headers 매개변수를 사용하여 요청을 보낼 수 있습니다. 이 방법은 API가 JWT 인증을 요구하는 경우 자주 사용됩니다. JWT를 사용한 Authorization 헤더 설정 예제import requestsfrom bs4 import BeautifulSoupdef fetch_jwt(response): # URL에서 웹 페이지를 가져옵니다. if response.status_code == 200: return response.headers.get('Authorization') else: return YO..

Web Crawling for Beginners 2024. 4. 25. 15:43

Python 사용자 인증 (Session) 받기

사용자 인증이 필요한 웹사이트를 크롤링할 때는 일반적으로 로그인 세션을 유지하는 방법이 필요합니다. 이는 주로 requests 라이브러리의 Session 객체를 사용하여 처리할 수 있습니다. Session 객체는 서버와의 연결에서 쿠키를 자동으로 처리하고, 동일한 세션 상태를 여러 요청에 걸쳐 유지합니다. 이 방법을 사용하면 로그인이 필요한 페이지에서 데이터를 크롤링할 수 있습니다. 예제: 로그인이 필요한 사이트 크롤링아래는 로그인이 필요한 웹사이트에 로그인하고 데이터를 추출하는 기본적인 코드 예제입니다. 예제에서는 아이디와 패스워드를 사용하여 로그인을 수행하고, 이후에 인증된 세션을 통해 접근이 제한된 페이지의 데이터를 크롤링합니다.import requestsfrom bs4 import Beautifu..

Web Crawling for Beginners 2024. 4. 25. 14:57

학습사이트 http://quotes.toscrape.com/ BFS 크롤링

http://quotes.toscrape.com/ 사이트를 너비 우선 탐색(BFS) 방법으로 크롤링하고, 크롤링된 데이터를 엑셀 파일에 저장하는 파이썬 스크립트를 작성해드리겠습니다. 이 스크립트는 각 페이지에서 인용구, 저자, 태그를 추출하고, 설정된 최대 깊이(max_depth)까지 탐색합니다. 필요한 라이브러리 설치다음 라이브러리를 설치하세요. requests와 BeautifulSoup는 웹 크롤링을 위해, pandas와 openpyxl은 엑셀 파일 작업을 위해 사용됩니다.pip install beautifulsoup4 requests pandas openpyxl 너비 우선 탐색(BFS) 웹 크롤러 코드import requestsfrom bs4 import BeautifulSoup..

Web Crawling for Beginners 2024. 4. 24. 13:59

학습사이트 http://books.toscrape.com BFS 크롤링

http://books.toscrape.com/ 사이트를 너비 우선 탐색(BFS) 방식으로 크롤링하는 파이썬 스크립트를 제공하겠습니다. 이 스크립트는 각 페이지를 방문하고, 각 책의 정보(제목, 가격, 재고 상태)를 추출하며, 모든 페이지를 방문할 때까지 'Next' 버튼을 통해 다음 페이지로 넘어갑니다. 필요한 라이브러리 설치pip install beautifulsoup4 requests 너비 우선 탐색(BFS) 웹 크롤러 코드import requestsfrom bs4 import BeautifulSoupfrom urllib.parse import urljoinfrom collections import dequedef get_books_from_page(soup): ""..

Web Crawling for Beginners 2024. 4. 24. 13:43

URL 깊이 우선 탐색(DFS) 웹 크롤러

깊이 우선 탐색(DFS) 알고리즘을 사용하여 웹 페이지를 크롤링하는 파이썬 코드를 설계하겠습니다. DFS 알고리즘은 각 링크를 따라 최대한 깊이 들어가면서 크롤링을 진행하며, 스택이나 재귀 함수를 사용하여 구현할 수 있습니다. 여기서는 재귀 함수를 사용하여 구현하겠습니다. 필요한 라이브러리 설치pip install beautifulsoup4 requests 깊이 우선 탐색(DFS) 웹 크롤러 코드import requestsfrom urllib.parse import urljoin, urlparsefrom bs4 import BeautifulSoupdef is_valid_url(base_url, url): """ 동일 도메인 내의 URL인지 검사하고, 유효한 링크인지 확인합니..

Web Crawling for Beginners 2024. 4. 24. 10:55

URL 너비 우선 탐색(BFS) 웹 크롤러

웹 페이지의 태그 링크를 따라가면서 연속적으로 URL을 찾아 분석하는 웹 크롤러를 만드는 것은 깊이 우선 탐색(DFS)이나 너비 우선 탐색(BFS)의 로직을 따를 수 있습니다. 여기서는 너비 우선 탐색을 사용한 기본적인 웹 크롤러를 설계하겠습니다. 이 크롤러는 시작 URL에서 링크를 추출하고, 각 링크를 방문하여 다시 링크를 추출하는 과정을 반복합니다. 몇 가지 단순화된 가정을 하고, 외부 링크는 무시하고 동일 도메인 내에서만 크롤링하도록 설정하겠습니다. 필요한 라이브러리 설치pip install beautifulsoup4 requests BFS 웹 크롤러 코드import requestsfrom urllib.parse import urljoin, urlparsefrom bs4 imp..

Web Crawling for Beginners 2024. 4. 24. 10:37

이전 Prev 1 ··· 15 16 17 18 19 20 21 ··· 117 Next 다음

목록전체 글 (929)

기억을 지배하는 기록

티스토리툴바