it-gundan.com

이상적인 자체 호스팅 검색 엔진은 무엇입니까?

여러 블로그와 포럼, 수백 개의 정적 페이지, 많은 PDF 파일 및 기타 여러 문서 유형으로 구성된 내부 (인트라넷) 사이트가 있습니다. 그것은 지난 몇 년 동안 느슨하게 붙어 있었으며 이제는 그것을 유지하는 것이 나의 일입니다.

이상적으로 다음과 같이 직접 호스팅 할 수있는 검색 엔진을 찾고 있습니다.

  1. 검색 할 데이터베이스 정보 및 테이블이 제공된 경우 블로그/포럼 데이터베이스를 직접 검색 할 수 있습니다.

  2. 대부분의 텍스트 문서를 처리합니다 (PDF/DOC/ODF)

  3. 오픈 소스이거나 구매 후 소스 코드에 액세스 할 수 있습니다

어떤 언어 나 플랫폼으로 작성되었는지는 중요하지 않습니다. 일반적으로 Google 사이트 검색 만 사용하지만 인트라넷에는 옵션이 아닙니다.

11
Tim Post

체크 아웃 Lucene

로 작성된 Java. NET 프레임 워크 에도 사용 가능

다음은 작동 방법 및 사용 방법을 설명하는 CodeProject 기사입니다. http://www.codeproject.com/KB/library/IntroducingLucene.aspx

7
jessegavin

나는 Sphider 전에 사용했고 꽤 감동했습니다.

2
Darryl Hein

SearchBlox Lucene을 기반으로 사용자의 요구를 충족시킬 수 있습니다. 무료이며 크롤러가 제공됩니다.

2
user5213

일반적으로 Google 사이트 검색 만 사용하지만 인트라넷에 대한 옵션은 아닙니다.

실제로 Google 검색 어플라이언스는 인트라넷에 대한 Google 사이트 검색과 동일합니다. 그러나 이것은 오픈 소스가 아닙니다 (Google 사이트 검색은 눈치 채지 못한 경우에도 마찬가지입니다).

0
delete