다양한 스니펫, 전략적 공략 노하우

사용자 검색 질의를 이해하는 능력을 키운 구글

2020.09.23

검색은 생존이다. 검색엔진 최적화는 웹 페이지 검색엔진이 관련 자료를 수집하고 순위를 매기는 방식에 맞게 웹페이지를 구성, 검색결과를 상위에 노출될 수 있도록 하는 작업이다. 따라서 검색엔진 최적화를 전략적으로 구사하기 위해서는 다양한 최적화 방법을 이해하고 하나씩 접근하는 방식이 필요하다. 그런 의미에서 이번 호부터 3회에 걸쳐 검색엔진 최적화를 성공적으로 이루기 위한 방법을 알아보기로 한다.

다양해진 스니펫 종류
다소 밋밋했던 구글의 검색 결과 페이지가 해가 바뀔수록 다채로워졌다. 검색 결과 페이지는 레귤러 스니펫(regular snippet), 리치 스니펫(rich snippet), 피처드 스니펫(featured snippet)으로 구분할 수 있다. ‘레귤러 스니펫’은 전통적으로 구글 검색엔진이 보여주던 방식이다. 제목과 요약문, 링크로 구성된다. 웹 페이지 내에 구조화된 데이터가 없으면 레귤러 스니펫으로 보인다. ‘리치 스니펫’은 이미지, 평점 등 다양한 정보를 함께 보여주는 방식이다.

레귤러 스니펫이나 리치 스니펫이 검색 결과 페이지의 가장 상단에 박스 표시와 함께 선정되면 이를 ‘피처드 스니펫’이라고 한다. ‘답변 박스’는 피처드 스니펫의 하나이며, 사용자의 검색 질의에 대해 답변 방식으로 검색 결과 페이지 상단에서 정보를 제공한다. 환율과 시간 같은 몇몇 검색어 형식에만 제공됐지만 사용자의 검색 질의를 이해하는 능력을 키운 구글은 점점 많은 검색어에 대해 바로 답변을 해주기 시작했다.

2019년 미국은 모든 검색 결과 페이지의 23%가 가장 상단에 박스 표시와 함께 표시되는 피처드 스니펫을 포함한다고 알려졌다. 이는 2016년에 비해 165%가 증가한 수치다. 피처드 스니펫이나 답변 박스로 노출되면 기존에 검색 결과 페이지 1순위에서 얻었던 트래픽 대비 600% 이상의 효과와 기존의 전환율 대비 400% 효과를 얻었다는 결과도 있다(출처: moz.com/blog/featured-snippets).

검색엔진 마케팅에서 트래픽을 얻기 위해서는 가장 상단에 노출되는 피처드 스니펫과 답변 박스에 많이 노출돼야 한다. 피처드 스니펫과 답변 박스에 노출되려면 여러 요소를 고려해야 한다. 그중 중요한 세 가지가 있다. 다음을 보자.

해당 키워드 검색 결과의 첫 번째 페이지에 노출되는 콘텐츠 만들기
해당 페이지에 구조화된 데이터 추가하기
질의 응답형 콘텐츠로 구성하기

먼저 피처드 스니펫에 선택된 페이지는 대부분 검색 결과 첫 페이지에 있는 내용이다. 따라서 검색어에 따라 해당 검색어를 입력하는 사용자의 의도를 효과적으로 충족시키는 콘텐츠를 발행해 검색 결과 첫 페이지에 노출될 수 있도록 해야 한다.

다음으로 중요한 항목은 해당 페이지의 내용을 검색엔진이 더 잘 이해할 수 있도록 특별한 코드를 추가하여 삽입하는 ‘구조화 데이터’ 작업이다. 보통 JSON-LD 형식으로 만들어서 HTML 문서 내에 포함한다.

마지막으로 질의 응답형으로 콘텐츠를 구성하면 답변 박스 혹은 피처드 스니펫에 포함될 가능성이 높다.

스키마 마크업
리치 스니펫과 피처드 스니펫 등의 결과는 HTML 소스 내에 포함된 구조화된 데이터를 활용한다. 구조화된 데이터는 음성 검색에서도 활용되기 시작했다. 이제 웹 페이지에 구조화된 데이터를 추가하는 온서프 SEO는 여러 측면에서 중요한 작업이다. 구조화된 데이터는 스키마 마크업(Schema Markup)을 이용해 표현하므로 온서프 SEO의 주요 작업인 스키마 마크업은 무엇일까?

‘마크업(markup)’이라는 단어는 웹 개발자나 SEO 마케터라면 이미 친숙한 단어다. HTML이 바로 마크업 언어이기 때문이다. 여기서 마크업은 데이터를 표시한다는 의미다. HTML은 내용과 형식을 분리한 ‘마크업’ 언어다. 예를 들어 <h1> 태그를 사용하면 큰 폰트로 해당 내용을 보여주고 <h2> 태그를 사용하면 <h1> 태그보다 작은 폰트로 해당 내용을 보여주는 식으로 내용과 형식을 분리하여 표시한 언어인 셈이다.

내용과 형식을 분리해 저장한 문서는 형식에 대한 표준(예를 들면 HTML5 같은 표준)이 있을 때 이런 형식을 지원하는 다양한 애플리케이션 또는 웹 브라우저에서 동일한 포맷으로 보일 수 있다. 마크업 언어가 정의되고 표준화되면 콘텐츠 생산자는 어떤 브라우저나 애플리케이션을 사용할 것인지 고려하지 않고 콘텐츠 생산에만 집중할 수 있는 장점이 있다. 또한 형식을 바꾸려고 할 때도 마크업 태그만 변경하면 일괄로 변경할 수 있다.

그러나 HTML은 ‘스키마 마크업’ 언어는 아니다. 즉 스키마를 이해하지 못하는 마크업 언어다. HTML은 내용과 형식을 분리하여 저장할 수는 있지만 내용에 대해서는 그 의미를 이해하지 못하고 데이터라고 뭉뚱그려서 이해하기도 한다. 즉 HTML은 태그 내 내용이 주소인지 사람 이름인지 전화번호인지 등을 이해하거나 정의할 능력이 없고 어떤 데이터는 <h1> 형식으로 보여주고 어떤 데이터는 <h2> 형식으로 표현하자는 규약에 불과하기도 하다.

<h1>Apple</h1> 같은 데이터는 검색엔진의 관점에서 ‘Apple’이라는 데이터를 좀 더 큰 폰트 사이즈로 보이도록 하는 정도의 의미만 있고, 그 데이터가 과일인지 기업명인지는 알 수 없다. ‘스키마’는 여기에 더 나아가서 어떤 데이터가 주소이고 어떤 데이터가 이름인지 등을 약속한 정의다. 만약 모든 웹 사이트가 스키마 마크업으로 정의돼 있다면 모든 웹 사이트에서 사람 이름이나 가격 정보를 수집하는 등의 작업을 할 수 있다.

schema.org를 방문하면 스키마 마크업에 대한 설명과 누구나 사용할 수 있도록 정리해놓은 스키마 마크업과 관련한 형식이 있다. 이를 이용해 스키마 마크업을 설정하면 웹 사이트에 있는 정보와 데이터들은 의미 있는 형태로 분류된다. 이는 SEO 랭킹에 도움되며 제품 및 서비스, 가격, 위치 등 필요한 정보를 곧바로 파악하는 데 용이하다.

스키마 마크업으로 표현한 구조화된 데이터는 페이지 정보를 제공하며 페이지 콘텐츠를 분류하기 위한 표준화된 형식이다. 레시피 유형의 경우 재료, 조리 시간, 온도, 칼로리 등이 여기에 해당한다. 이때 스키마 마크업은 JSON-LD, Microdata, RDFa 같은 언어로 표현한다.

1. JSON-LD

JSON-LD(JavaScript Object Notation for Linked Data)는 JSON 형식을 사용해 링크된 데이터를 인코딩하는 방법이다. 페이지 헤드 또는 본문의 <script> 태그 내에 삽입되는 자바스크립트 표기이며, 스키마 마크업 부분은 사용자가 볼 수 있는 텍스트와 함께 표시되지 않는다.

다음은 지식 정보 디스플레이에 로고 이미지를 표시하는 JSON-LD 예시다.

2. Microdata

마이크로데이터(Microdata)는 HTML 콘텐츠 내 구조화된 데이터를 중첩하는 데 사용하는 개방형 커뮤니티 HTML 사양이다. RDFa와 같이 HTML 태그 속성을 사용해 구조화된 데이터로 표시하려는 속성의 이름을 지정한다. 대개 페이지 본문에 사용하지만 헤드에도 사용할 수 있다.

마이크로데이터가 ‘기관차locomotive’를 마크업한 형식을 보자. ” “는 “itemtype”와 함께 작동해 블록에 포함한 HTML이 특정 항목에 대한 것임을 지정한다. ” “는 item을 만들고 해당 항목과 연결된 항목 유형의 범위를 정의한다. item이 사람 이름이라면 itemtype은 사람이다. “itemtype”는 항목 및 해당 속성 컨텍스트를 설명하는 어휘의 유효한 URL이다. “itemid”는 item의 특별한 글로벌 식별자다. “itemprop”은 Item의 property를 만든다. 모든 HTML 요소에는 “itemprop” 속성이 지정될 수 있으며 이름과 값이 짝을 지어 구성된다.

3. RDFa

RDFa(Resource Description Framework in Attributes)는 웹 문서 내 풍부한 메타데이터를 포함하기 위해 HTML, XHTML 및 다양한 XML 기반 문서 유형의 속성 수준을 확장해 추가하는 방식이다. 검색엔진에 제시하려는 콘텐츠에 해당하는 HTML 태그 속성을 도입해 연결된 데이터를 지원하는 HTML5 확장이라고 볼 수 있다. RDFa는 일반적으로 HTML 페이지의 헤드와 본문 섹션 모두 사용할 수 있다.

구글의 검색 노출 요소

구조화된 데이터 유형	기능 및 설명	지원 상태
기사	검색 결과에서 이미지, 헤드라인 텍스트 등을 표시할 수 있다.
도서	도서명과 저자 등을 표시한다.	제한된 액세스
학습과정	교육 과정 목록을 마크업할 수 있다. 홍보나 할인, 구매 안내를 할 수는 없다.
비평가 리뷰	영화, 도서, 지역 비즈니스에 대한 리뷰를 제공한다.	제한된 액세스
직무 교육	직업 교육 환경에 대한 정보를 제공한다.	베타

(출처: developers.google.com, e비즈북스 재인용)

도서나 비평가 리뷰처럼 제한된 엑세스 유형은 구글에 신청하거나 구글이 적합한 업체라고 판단한 업체만 활용할 수 있다. 이미지 라이선스 메타데이터, 직무 교육, 스피커플과 같이 베타로 지정된 유형은 향후 변하거나 지원이 중단될 수도 있다. 모든 유형이 모든 지역과 언어에서 지원되지는 않는다. 구조화된 데이터의 유형을 정했다면 구글 개발자 사이트(developers.google.com)를 방문, 타깃 지역과 언어 지원을 확인해야 한다.

비평가 리뷰와 리뷰 스니펫은 유사하게 보이지만 많이 다르다. 비평가 리뷰는 구글이 적합한 업체라고 판단한 업체만 활용할 수 있습니다. 리뷰 스니펫은 지역 업체에 추가할 수는 없으며, 도서, 교육 과정, 이벤트, 방법, 영화, 제품, 레시피, 소프트웨어 애플리케이션 등에서 보입니다. 만약 소유한 웹 사이트에 해당 웹 사이트의 리뷰 스니펫 유형을 추가하는 경우는 셀프 서빙self serving으로 간주돼 무시된다. 유형 중에서 FAQ와 Q&A를 헷갈리기 쉽다.

사용자가 대체 답변을 제출할 방법이 없는, 사이트 자체에서 작성한 질의 응답 페이지는 FAQ 유형을 적용한다. 그러나 사용자가 질문에 답변을 제출할 수 있거나 질문과 답변 모두 제출할 수 있다면 Q&A 유형으로 마크업한다. 구글은 구조화된 데이터를 웹 페이지에 포함하기를 권장하고 있으나 가이드라인을 따르지 않을 경우 검색에서 순위가 낮아지거나 리치 결과에 포함하지 않는다. 특히 스팸성 데이터가 있다고 판단되면 검색 결과에서 제외될 수도 있다. 구글에서 제공하는 마크업 가이드라인은 다음과 같다.

•기술적으로는 JSON-LD, 마이크로데이터, RDFa 중 하나를 사용하여 마크업해야 한다. JSON-LD 형식을 권장한다.

•Robots.txt, NOINDEX 등으로 구조화된 데이터 페이지 접근을 차단하지 않는다.

•구조화된 데이터가 페이지 콘텐츠를 실제로 표현해야 한다. 즉 페이지 콘텐츠에 없는 내용을 구조화된 데이터에 포함할 수 없다.

•구조화된 데이터 유형에 필요한 필수 속성을 모두 지정한다. 필수 속성을 제대로 입력했는지 여부는 구글 서치 콘솔 또는 구글의 구조화된 데이터 테스트 도구로 확인할 수 있다.

•이미지를 구조화된 데이터 속성으로 지정하는 경우 해당 이미지가 실제로 해당 유형의 웹 페이지에 속해야 한다. 즉 schema.org/NewsArticle.image의 image 속성을 정의한 마크업 이미지는 해당 뉴스 기사에 직접 포함해야 한다.

•모든 이미지 URL은 크롤링 및 색인 생성을 할 수 있어야 한다.

구조화된 데이터가 포함된 웹 페이지의 검색 순위는 다른 웹 페이지보다 낮더라도 검색 사용자의 클릭을 유도해 더 많은 관심을 얻을 확률이 높다. 또한 검색 결과에 표시되는 이미지, 동영상 등 검색 사용자가 웹 사이트에 접속하지 않고도 해당 웹 사이트를 더 정확하게 파악하도록 도와준다. 검색 결과에 해당 제품 및 서비스를 명확하게 제시함으로써 타깃 고객이 아닌 사용자의 유입을 낮추고 실제 타깃 고객의 웹 페이지 방문 시간과 전환율은 올라가도록 유도할 수 있다. 리치 스니펫은 전환율을 5~30% 향상할 수 있다고 알려져 있으며, 콘텐츠가 명확한 목적이 있음을 보여주는 효과가 있다.

구조화된 데이터는 구글 검색 로봇이 웹 사이트의 콘텐츠를 더 잘 이해할 수 있도록 돕는다. 구글 검색 로봇은 꾸준히 진화하고 있지만 아직 불완전하다. 사람처럼 사진, 글, 동영상을 읽을 수 없기에 구조화된 데이터는 검색 로봇에게 코딩을 사용해 웹 사이트를 설명해야 한다. 웹 사이트를 더 잘 이해한 검색 로봇은 제품 및 서버와 관련된 사용자를 발견했을 때 해당 웹 사이트를 더 잘 노출해주며 결과적으로 검색 순위 향상에 도움되기 때문이다.

글. 김건오(《트래픽을 쓸어 담는 검색엔진 최적화》 저자, 현 트윈워드 대표, 컴퓨터공학 박사, 전 삼성SDS, 유럽연합 R&D 프로젝트 구축 외)
자료제공. e비즈북스
정리. 김관식 에디터 seoulpol@wirelink.co.kr

뉴스콘텐츠는 저작권법 제7조 규정된 단서조항을 제외한 저작물로서 저작권법의 보호대상입니다. 본 기사를 개인블로그 및 홈페이지, 카페 등에 게재(링크)를 원하시는 분은 반드시 기사의 출처(로고)를 붙여주시기 바랍니다. 영리를 목적으로 하지 않더라도 출처 없이 본 기사를 재편집해 올린 해당 미디어에 대해서는 합법적인 절차(지적재산권법)에 따라 그 책임을 묻게 되며, 이에 따른 불이익은 책임지지 않습니다.

에디터김 관식 (seoulpol@wirelink.co.kr)

김 관식

김 관식님의 다른 아티클 더 보기

다양한 스니펫, 전략적 공략 노하우

김 관식

김 관식님의 다른 아티클 더 보기

당신이 좋아할 만한 아티클

초상집 상복 벗어 던지나… 다음이 4색 로고 디자인을 롤백한 이유는?

인간공학과 사용자 중심 디자인(UCD)의 선구자 헨리 드레이퍼스

前 게티이미지코리아 대표, 그는 왜 생활폐기물 DX에 뛰어 들었을까?

“앱 갈아엎었는데 평점 4.7?” IBK기업은행이 ‘슈퍼앱’ 대신 택한 승부수

인기있는 아티클

소비 심리 변화로 본 2026년 ‘리커머스’ 키워드 3가지

“앱 갈아엎었는데 평점 4.7?” IBK기업은행이 ‘슈퍼앱’ 대신 택한 승부수

데이터 너머의 공감으로… 사람을 위한 AI 금융이란 무엇일까?

초상집 상복 벗어 던지나… 다음이 4색 로고 디자인을 롤백한 이유는?