(adsbygoogle = window.adsbygoogle || []).push({}); O_o :: 'Google' 태그의 글 목록

'Google'에 해당되는 글 3건

  1. 2008.10.21 Google 등록 뉴스 사이트맵 작성
  2. 2008.10.21 Google 등록 사이트맵 작성 요령
  3. 2008.10.21 Google 등록 웹마스터 가이드라인

Google 등록 뉴스 사이트맵 작성

|

뉴스 Sitemap 만들기

시작하기 전에 사이트가 Google 뉴스에 포함되어 있는지 확인합니다. 포함되어 있지 않으면 Google 뉴스에 포함되도록 요청할 수 있습니다.

뉴스 Sitemap에서는 아래와 같이 다양한 형식의 Sitemap 프로토콜을 사용합니다.

네임스페이스/urlset 태그
  • 뉴스 스키마에 대한 두 번째 네임스페이스를 다음과 같이 추가해야 합니다.
    http://www.google.com/schemas/sitemap-news/0.9
    뉴스 Sitemap에 대한 urlset 태그는 다음과 같습니다.
    <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"    xmlns:news="http://www.google.com/schemas/sitemap-news/0.9">
URL 목록
  • 각 URL은 아래 표에 설명된 뉴스별 태그(선택사항)를 뉴스 스키마 내에 포함시킬 수 있습니다. 모든 태그가 사용된 URL의 예는 다음과 같습니다.
    <url>
    <loc>http://mynewssite.com/article123.html</loc>
    <news:news>
    <news:publication_date>2006-08-14T03:30:00Z</news:publication_date>
    <news:keywords>비즈니스, 인수, 합병s</news:keywords>
    </news:news>
    </url>

    <loc> 태그는 기사 페이지의 URL이어야 합니다.

    뉴스별 태그 정의

    태그 필수 여부 설명
    <publication_date>
    W3C 형식의 기사 발행일로, 시간 정보를 포함할 것을 권장합니다. Sitemap 파일에 기사 발행일 태그를 포함시키지 않을 경우에는 해당 페이지 자체에 발췌할 수 있는 날짜가 포함되어야 합니다. Google 뉴스에서 해당 기사의 발행일을 정확하게 알아야 하기 때문입니다. Sitemap 파일에 기사의 날짜가 없고 기사 자체에도 발췌 가능한 날짜가 없으면 해당 기사는 Google 뉴스에 게재되지 않으며 웹마스터 도구에 있는 뉴스 크롤링 오류 페이지의 기사에 "날짜를 찾을 수 없음" 오류가 표시됩니다.
    <keywords>
    선택사항 분리된 키워드 목록은 기사의 내용을 나타냅니다. 키워드는 기존 Google 뉴스 카테고리 목록을 포함하여 여러 곳에서 가져올 수 있습니다.
  • 뉴스 Sitemap의 기사는 모두 동일한 게시물 라벨을 가지고 있어야 합니다. 일반적으로 게시물 라벨에 따라 게시물 이름과 언어가 달리 지정됩니다. 예를 들어, 사이트에 The Example Times(영어)Journal Exemplaire(프랑스어)를 게재한다면 각 게시물에 대해 하나씩 총 2개의 게시물 라벨이 있어야 합니다. 사이트에 사용할 수 있는 게시물 라벨은 뉴스 Sitemap을 추가할 때 나타나는 메뉴에서 찾을 수 있습니다. 사이트에 구독 콘텐츠와 비구독 콘텐츠 또는 보도자료와 보도자료가 아닌 콘텐츠가 혼합되어 있는 경우 해당 기사유형에 대한 게시물 라벨이 추가로 표시됩니다. 각 게시물 라벨에 대한 기사를 별도의 Sitemap으로 제출하시기 바랍니다. 필요한 게시물 라벨을 사용할 수 없는 경우 Google 뉴스 지원팀에 문의하여 추가하도록 요청하시기 바랍니다.

  • 뉴스 Sitemap은 URL을 최대 1,000개만 포함할 수 있습니다. 이는 뉴스 Sitemap이 사이트의 최신 뉴스 기사만 포함하도록 하기 위함입니다. 따라서 뉴스 Sitemap을 수시로 업데이트하는 것이 좋습니다. Google 뉴스에서는 뉴스 Sitemap을 계속 검색하여 최신 콘텐츠를 크롤링합니다.

다음은 기사를 하나만 포함하는 뉴스 Sitemap의 예입니다.

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:news="http://www.google.com/schemas/sitemap-news/0.9">
<url>
<loc>http://mynewssite.com/article100.html</loc>
<news:news>
<news:publication_date>2006-08-17T03:19:00Z</news:publication_date>
<news:keywords>스포츠, 야구</news:keywords>
</news:news>
</url>
</urlset>

뉴스 Sitemap을 만든 후 뉴스 기사를 포함하는 최상위 디렉토리에 업로드한 다음 Google 에 제출합니다.

문의사항은 Sitemap 프로토콜 Google 그룹스 토론 포럼을 참조하시기 바랍니다.

And

Google 등록 사이트맵 작성 요령

|

Sitemap이란 무엇인가요?

일반적으로 Sitemap에는 두 가지 유형이 있습니다. 첫 번째 Sitemap 유형은 사이트 페이지가 나열된 HTML 페이지로 섹션별로 구분하는 것이 일반적이며, 사용자가 필요한 정보를 찾을 수 있도록 하기 위한 것입니다.

Sitemap이라고 하는 XML Sitemap으로는 사이트 정보를 Google에 알릴 수 있습니다. 지금부터 이 Sitemap 유형에 대해 살펴보도록 하겠습니다.

XML Sitemap은 간단하게 Sitemap이라고 하며 웹사이트에 포함된 페이지를 나열합니다. Sitemap을 만들어 제출하면 Google의 일반적인 크롤링 과정에서 발견되지 않는 URL까지 포함하여 사이트의 모든 페이지 정보를 Google에 알릴 수 있습니다.

Sitemap이 특히 유용하게 사용되는 경우는 다음과 같습니다.

  • 동적 콘텐츠가 있는 사이트
  • AJAX 또는 Flash 등과 같이 크롤링 과정 동안 Googlebot이 쉽게 검색하지 못하는 페이지가 있는 사이트
  • 연결되는 링크가 많지 않은 새로운 사이트. Googlebot은 페이지간 링크를 통해 웹을 크롤링합니다. 따라서 링크 연결이 잘 되어 있지 않은 사이트의 경우 Googlebot이 쉽게 검색하지 못할 수도 있습니다.
  • 서로 잘 연결되지 않거나 전혀 연결되지 않는 콘텐츠 페이지를 보관하는 대형 보관함이 있는 사이트

또한 Sitemap을 사용하여 페이지에 대한 다음과 같은 추가 정보를 Google에 제공할 수 있습니다.

  • 사이트의 페이지가 변경되는 빈도. 예를 들어, 제품 페이지는 매일 업데이트되지만 내 정보 페이지는 몇 달에 한 번씩 업데이트됩니다.
  • 각 페이지가 최종 수정된 날짜
  • 사이트 페이지 간의 상대적인 중요도. 예를 들어 홈페이지의 상대적인 중요도를 1.0이라고 하면 카테고리 페이지는 0.8, 개별 블로그 항목이나 제품 페이지는 0.5라고 할 수 있습니다. 이 우선순위는 특정 URL과 기타 URL을 비교한 상대적인 중요도만 나타낼 뿐 실제 검색결과에서 페이지의 순위에는 영향을 미치지 않습니다.

Sitemap은 사이트에 대한 추가 정보를 Google에 제공함으로써 일반적인 Google의 웹 크롤링 방식을 보완할 수 있습니다. 이를 통해 사이트에서 더 많은 페이지를 더 짧은 시간에 크롤링할 수 있으나, Sitemap의 URL이 모두 Google 색인에 추가된다고 보장할 수는 없습니다. 하지만 Sitemap 제출로 인해 사이트에 벌점이 부여되는 경우도 없습니다.

Google은 sitemaps.org에서 규정하는 Sitemap Protocol 0.9를 준수합니다. Sitemap 프로토콜은 웹 크롤러와 관련이 있는 Sitemap 정보를 요약하기 위한 XML입니다. 따라서 Sitemap Protocol 0.9를 사용하여 Google용으로 만든 Sitemap은 sitemaps.org의 기준을 채택한 다른 검색엔진과 호환됩니다.

대부분의 사이트는 표준 Sitemap으로 충분하지만 특정 유형의 콘텐츠에 대해서는 특수 Sitemap을 만들어 제출할 수도 있습니다. 이러한 Sitemap 형식은 Google 전용으로 다른 검색엔진에서는 사용할 수 없으며, 특정 콘텐츠 유형에 대한 세부정보를 Google에 제공할 수 있습니다. 예를 들어, 사이트 운영자는 뉴스 Sitemap을 통해 Google 뉴스 검색결과에 게재될 수 있는 정보 즉, 발행일, 키워드 및 주식 종목 기호와 같은 정보를 Google에 제공할 수 있습니다. Sitemap 형식에는 다음과 같은 것이 있습니다.

And

Google 등록 웹마스터 가이드라인

|

웹마스터 가이드라인

다음 가이드라인을 준수하면 Google이 내 웹사이트를 찾아 색인에 포함시키고 순위를 지정하는 데 도움이 됩니다. 해당 가이드라인의 제안사항을 따르지 않는 경우에도 '품질 가이드라인' 섹션은 자세히 읽어보는 것이 좋습니다. 이 섹션에는 Google 색인에서 사이트가 완전히 삭제되거나 벌점이 부여되는 결과를 초래할 수 있는 불법 행위에 대해서도 간략히 설명되어 있습니다. 벌점이 부여된 사이트는 Google.co.kr 또는 Google 파트너 사이트의 검색결과에 더 이상 나타나지 않습니다.

사이트를 Google 검색결과에 추가할 준비가 되었으면 다음 단계를 따르세요.

  • 다른 관련 사이트를 귀하의 사이트에 연결합니다.
  • http://www.google.com/addurl.html에서 사이트를 Google에 제출합니다.
  • Google 웹마스터 도구의 일부로 Sitemap을 제출합니다. Google은 제출된 Sitemap을 사용하여 사이트의 구조를 확인하고 웹페이지를 모두 포함할 수 있도록 Google 검색범위를 확장합니다.
  • 페이지 상태를 알고 있어야 하는 모든 사이트에 귀하의 사이트가 온라인 상태임을 알립니다.
  • 오픈 디렉토리 프로젝트(Open Directory Project)나 Yahoo! 같은 관련 디렉토리뿐 아니라 기타 업종별 전문 사이트에도 사이트를 제출합니다.

디자인 및 콘텐츠 가이드라인

  • 계층 구조와 텍스트 링크가 명확한 사이트를 만듭니다. 모든 페이지는 하나 이상의 정적 텍스트 링크를 통해 도달할 수 있어야 합니다.
  • 사이트의 주요 섹션으로 이어지는 링크를 사이트 맵을 통해 사용자에게 제공합니다. 사이트 맵에 포함된 링크가 100개 이상이면 너무 복잡하므로 별도의 페이지로 나누는 것이 좋습니다.
  • 풍부한 정보를 제공하는 유익한 사이트를 만들고 콘텐츠를 명확하고 정확하게 설명하는 페이지를 작성합니다.
  • 자신의 페이지를 찾기 위해 사용자들이 어떤 단어를 입력할지 생각해 보고 실제로 사이트에 해당 단어를 사용합니다.
  • 이미지가 아닌 텍스트를 사용하여 중요한 이름이나 콘텐츠, 링크를 표시합니다. Google 크롤러는 이미지 안에 포함된 텍스트를 인식하지 못합니다.
  • TITLE 태그와 ALT 속성이 정확하며 해당 내용을 제대로 설명하고 있는지 확인합니다.
  • 깨진 링크가 있는지 확인하고 HTML을 수정합니다.
  • 동적 페이지(예: ? 문자가 포함된 URL)를 사용하는 경우, 일부 검색엔진 스파이더는 동적 페이지는 물론 정적 페이지도 크롤링하지 않을 수 있습니다. 매개변수의 경우 길이는 짧게, 개수는 적게 유지하면 도움이 됩니다.
  • 한 페이지에서 링크 수를 100개 미만으로 적절하게 유지합니다.

기술 가이드라인

  • 대부분의 검색엔진 스파이더가 Lynx와 매우 유사한 방식으로 사이트를 확인하므로 Lynx와 같은 텍스트 브라우저를 사용하여 사이트를 검토하세요. 자바스크립트, 쿠키, 세션 ID, 프레임, DHTML 또는 플래시 같은 고급 기능으로 인해 텍스트 브라우저에 전체 사이트가 표시되지 않으면 검색엔진 스파이더 역시 해당 사이트를 제대로 크롤링하지 못할 수도 있습니다.
  • 세션 ID나 사이트의 경로를 추적하는 인수 없이도 검색봇이 사이트를 크롤링할 수 있도록 허용합니다. 세션 ID나 경로 추적 인수를 사용하는 기술은 개별적인 사용자 동작을 추적할 때는 유용하지만, 봇의 액세스 패턴 면에서는 전혀 그렇지 않습니다. 해당 기술을 사용할 경우 봇은 모양은 다르지만 실제로 같은 페이지로 연결되는 URL을 삭제하지 못하므로 사이트가 색인에 완전히 등록되지 않을 수도 있습니다.
  • 웹서버가 If-Modified-Since HTTP 헤더를 지원하는지 확인합니다. 이 기능을 사용하면 웹서버에서 마지막 사이트 크롤링 후 콘텐츠 변경 여부를 Google에 알려줄 수 있습니다. 이 기능이 지원되면 크롤링에 사용되는 대역폭과 오버헤드가 줄어듭니다.
  • 웹서버에서 robots.txt 파일을 사용합니다. 이 파일은 크롤링할 디렉토리와 크롤링하지 않아야 할 디렉토리를 크롤러에 알려줍니다. 실수로 Googlebot 크롤러를 차단하지 않도록 최신 사이트 정보로 파일을 업데이트하세요. 로봇이 사이트를 방문할 때 로봇에게 지시하는 방법은 http://www.robotstxt.org/wc/faq.html 페이지를 참조하시기 바랍니다. robots.txt 파일을 올바르게 사용하고 있는지 테스트하려면 Google 웹마스터 도구에 있는 robots.txt 분석 도구를 사용하세요.
  • 회사에서 콘텐츠 관리 시스템을 구입한 경우 검색엔진 스파이더가 사이트를 크롤링할 수 있도록 해당 시스템에 콘텐츠를 내보내는 기능이 있어야 합니다.
  • robots.txt를 사용하면 검색결과 페이지 또는 기타 자동생성 페이지 등 검색엔진을 통해 방문하는 사용자에게 기존 페이지와 다른 추가적인 가치가 많지 않은 페이지들이 크롤링되는 것을 막을 수 있습니다.

품질 가이드라인

품질 가이드라인에서는 가장 일반적으로 볼 수 있는 기만 행위나 조작 행위를 설명합니다. 그러나 가이드라인에 나와 있지 않더라도 널리 알려진 웹사이트의 철자를 오기하여 등록함으로써 사용자를 기만하는 행위 등 위반의 소지가 있는 기타 행위 또한 Google의 금지 대상이 될 수 있습니다. 특정 기만 행위가 이 페이지에 나와 있지 않다고 해서 Google이 해당 행위를 허용하는 것으로 가정해서는 안 됩니다. 품질 가이드라인에 설명된 기본 원칙을 준수하기 위해 노력하면 이를 악용하는 사이트보다 사용자에게 보다 만족스러운 서비스를 제공할 수 있으므로 결국 해당 사이트의 게재순위도 높아지게 됩니다.

Google의 품질 가이드라인을 악용하는 것으로 판단되는 사이트가 있으면 https://www.google.com/webmasters/tools/spamreport?hl=ko에 서 해당 사이트를 신고하시기 바랍니다. Google은 스팸 퇴치를 위해 직접 나서기보다는 확장가능하고 자동화된 방법으로 문제를 해결해 나가고자 합니다. 접수되는 스팸 신고사항은 향후 스팸 시도를 파악하고 차단하는 확장가능한 알고리즘을 개발하는 데 사용됩니다.

품질 가이드라인 - 기본 원칙

  • 검색엔진이 아니라 사용자를 위한 페이지를 만듭니다. 사용자를 속이거나, 사용자에게 표시되는 콘텐츠와 다른 콘텐츠를 검색엔진에 제공하면 안 됩니다. 이런 행위를 흔히 '클로킹'이라고 합니다.
  • 검 색엔진 순위를 높이기 위한 변칙적인 행위는 피해야 합니다. 그러려면 경쟁 웹사이트에 대해 자신이 한 행위를 누구에게나 떳떳하게 설명할 수 있어야 합니다. 또한 이 작업이 사용자에게 도움이 되는지, 검색엔진이 없었더라도 같은 작업을 했을지 자신에게 되묻는 것도 유용한 판단 기준이 됩니다.
  • 사이트의 순위나 PageRank를 높이기 위해 만들어진 링크 전략을 사용하지 않습니다. 특히 웹 스패머나 웹 상의 '위험한 사이트'에 대한 링크가 있으면 사이트의 순위가 내려갈 수 있으므로 이러한 링크는 피하는 것이 좋습니다.
  • 페이지 제출, 순위 확인 등을 위해 허가되지 않은 컴퓨터 프로그램을 사용하지 않습니다. 이러한 프로그램을 사용할 경우 대량의 컴퓨팅 리소스가 소비될 뿐 아니라 Google 서비스 약관에도 위배됩니다. 자동 또는 프로그래밍 방식 검색어를 Google에 보내는 WebPosition Gold™ 같은 제품은 사용하지 않는 것이 좋습니다.

품질 가이드라인 - 세부사항

사이트가 본 가이드라인에 부합하지 않는 것으로 판단되면 가이드라인에 부합하도록 사이트를 수정하고 사이트 재검토 요청을 제출하시기 바랍니다.

And
prev | 1 | next