
미디어크롤러: 셀프 미디어 크롤러
무료

MediaCrawler는 다양한 소셜 미디어 플랫폼에서 데이터를 추출하도록 설계된 셀프 미디어 크롤러입니다. 키워드 또는 특정 ID를 기반으로 게시물 및 댓글을 검색하는 기능 등을 제공합니다. 여러 플랫폼과 데이터베이스 옵션(SQLite 및 MySQL)을 지원합니다. Python 3.11 및 Node.js(일부 플랫폼용)가 필요합니다. 사용자는 댓글 추출 및 데이터베이스 선택과 같은 설정을 구성할 수 있습니다. 설명서에는 설정 지침, 프로젝트 아키텍처 세부 정보 및 문제 해결 가이드가 포함되어 있습니다. 기부 및 개발자 지원 옵션도 제공합니다. 이 프로젝트는 종속성 관리를 위해 uv를 사용하고 브라우저 자동화를 위해 Playwright를 사용합니다.
다양한 소셜 미디어 플랫폼에서 데이터를 크롤링합니다.
키워드 또는 특정 ID를 사용하여 게시물 및 댓글을 검색할 수 있습니다.
데이터 저장을 위해 SQLite 및 MySQL을 지원합니다.
일관된 Python 종속성 관리를 위해 `uv`를 사용합니다.
브라우저 상호 작용을 위해 Playwright를 사용합니다.
`config/base_config.py`에서 사용자 정의 옵션을 제공합니다.
Python 3.11 및 Node.js(버전 >= 16.0.0)를 설치합니다., uv sync를 사용하여 Python 종속성을 관리합니다., Playwright 브라우저 드라이버를 설치합니다: playwright install., config/base_config.py에서 설정을 구성합니다(예: 댓글 추출 활성화)., python main.py --platform --lt qrcode --type search와 같은 명령을 사용하여 크롤러를 실행합니다.
특정 키워드 또는 주제와 관련된 콘텐츠를 추적하고 분석합니다.
연구 또는 분석을 위해 여러 플랫폼에서 게시물 및 댓글을 수집합니다.
감성 분석, 트렌드 식별 및 기타 분석 목적으로 데이터를 수집합니다.
연구 프로젝트를 위해 소셜 미디어 데이터를 수집하고 분석합니다.
비즈니스 인텔리전스를 위해 소셜 미디어 데이터를 수집하고 처리합니다.
특정 데이터 추출 요구 사항에 맞게 크롤러를 사용하고 사용자 정의합니다.
MediaCrawler는 오픈 소스 프로젝트이며 무료로 사용할 수 있습니다.