it-gundan.com

도메인 스쿼터를 가리키는 링크를 어떻게 감지합니까?

404 페이지로 연결되는 죽은 링크를 찾는 방법을 알고 있습니다. 그러나 요즘에는 많은 링크가 실제로 죽지 않지만 대신 도메인 스쿼터로 연결됩니다. 나는 이것이 큰 주문이라는 것을 알고 있지만 실제로 브라우저로 각 사이트를 방문하고 배낭 등을 가진 소녀의 사진이 있는지 확인하지 않고 웹 사이트가 실제로 도메인 스쿼터인지 확인할 수있는 방법이 있습니까? .?

4
delete

선점 페이지/도메인에 대한 가능한 감지 방법 :

정크 문구 찾기

"필요한 경우, 필요할 때"및 "거의 모든 소스"와 같은 일반적인 일반적인 정크 문구를 대소 문자를 구분하지 않고 검색하십시오.

구매 초대장 찾기

"이 도메인에 대해 문의"및 "이 도메인은 판매용 일 수 있습니다"와 같은 텍스트를 찾으십시오.

임의의 서브 페이지에서 404 테스트

testdomain.com/randomstring를 방문하십시오. 404를 얻거나 페이지 자체에 텍스트 '404'또는 '찾을 수 없음'이 포함되어 있으면 주차되지 않은 것일 수 있습니다.

임의의 서브 페이지에서 리디렉션 테스트

다른 선점 도메인 시스템은 testdomain.com/randomstring을 (를) testdomain.com으로 리디렉션합니다.

메타 태그에서 도메인 이름 검색

여러 도메인 도메인 템플릿은 제작자 메타 태그에 다음 형식을 사용합니다.

<meta name="author" content="Nameofdomain.com" />

다른 사람들은 설명에 넣습니다.

<meta name="description" content="nameofdomain.com">

각 경우에 도메인은 'content'속성에서 only 것입니다. 활성 사이트에는 해당되지 않을 수 있습니다.

프레임 세트 태그를 찾으십시오

일부 파킹 된 도메인 템플릿은 내부 콘텐츠가 여러 개인 <frameset> 태그를 사용하여 외부 콘텐츠 ( 'information.com'에서 가져 오기)를 가져 오지만 페이지에는 다른 기능이 없습니다.

여러 테스트 사용

이러한 테스트 중 하나만이 반드시 도메인 파킹 도메인의 신뢰할 수있는 지표는 아닙니다. 고유 한 알고리즘을 생성하기 위해 여러 테스트를 결합한 다음 알려진 도메인과 알려진 활성 도메인을 기반으로 알고리즘을 테스트하고 세분화해야합니다.

2
Nick

찾을 수있는 것들이 있습니다. 페이지의 주요 요소가 iFrame입니까? 응답이 도메인 외부로 연결되는 301/302입니까? 많은 스쿼터가 방문 페이지로 302 또는 301합니다. 링크/텍스트 비율이 엄청나게 높습니까?

나는 그것이 매우 어렵다고 말하고 싶지만 그것은 적어도 몇 가지 공통적 인 특징입니다.

Wikipedia linkrot 페이지에는이를 시도하는 일부 프로젝트를 참조하는 프로젝트가있는 것 같습니다 : http://en.wikipedia.org/wiki/Wikipedia_talk:Linkrot -details 그래도 스케치입니다.

0
Mark Henderson