Structured Data สำหรับชุดข้อมูล (Dataset, DataCatalog, DataDownload)

เราจะพบชุดข้อมูลได้ง่ายขึ้นเมื่อคุณให้ข้อมูลสนับสนุน เช่น ชื่อ คำอธิบาย ผู้สร้าง และรูปแบบการเผยแพร่เป็น Structured Data วิธีการค้นพบชุดข้อมูลของ Google ใช้ประโยชน์จาก schema.org และมาตรฐานข้อมูลเมตาอื่นๆ ที่เพิ่มลงในหน้าที่อธิบายชุดข้อมูลได้ วัตถุประสงค์ของมาร์กอัปนี้คือการปรับปรุงการค้นพบชุดข้อมูลจากสาขาต่างๆ เช่น วิทยาศาสตร์ชีวภาพ สังคมศาสตร์ แมชชีนเลิร์นนิง ข้อมูลภาคพลเมืองและภาครัฐ เป็นต้น คุณค้นหาชุดข้อมูลได้โดยใช้เครื่องมือ Dataset Search

ตัวอย่างของ Dataset Search

ต่อไปนี้คือตัวอย่างของสิ่งที่จัดว่าเป็นชุดข้อมูล

  • ตารางหรือไฟล์ CSV ที่มีข้อมูล
  • คอลเล็กชันตารางที่มีการจัดระเบียบ
  • ไฟล์ในรูปแบบกรรมสิทธิ์ที่มีข้อมูล
  • คอลเล็กชันไฟล์ที่ประกอบกันขึ้นเป็นชุดข้อมูลที่มีความหมาย
  • ออบเจ็กต์ที่มีโครงสร้างซึ่งมีข้อมูลในรูปแบบอื่นที่คุณอาจต้องโหลดลงในเครื่องมือพิเศษเพื่อการประมวลผล
  • รูปภาพที่มีข้อมูล
  • ไฟล์เกี่ยวกับแมชชีนเลิร์นนิง เช่น พารามิเตอร์ที่เทรนไว้ หรือคำจำกัดความโครงสร้างของโครงข่ายระบบประสาทเทียม

วิธีเพิ่มข้อมูลที่มีโครงสร้าง

ข้อมูลที่มีโครงสร้างคือรูปแบบมาตรฐานในการแจ้งข้อมูลเกี่ยวกับหน้าและจำแนกประเภทเนื้อหาของหน้า หากคุณเพิ่งใช้ข้อมูลที่มีโครงสร้างเป็นครั้งแรก โปรดดูข้อมูลเพิ่มเติมเกี่ยวกับวิธีการทำงานของข้อมูลที่มีโครงสร้าง

ต่อไปนี้เป็นภาพรวมเกี่ยวกับวิธีสร้าง ทดสอบ และเผยแพร่ข้อมูลที่มีโครงสร้าง ดูคำแนะนำทีละขั้นตอนเกี่ยวกับวิธีเพิ่มข้อมูลที่มีโครงสร้างลงในหน้าเว็บได้ใน Codelab สำหรับข้อมูลที่มีโครงสร้าง

  1. เพิ่มพร็อพเพอร์ตี้ที่จำเป็น ดูตำแหน่งการแทรก Structured Data ในหน้าเว็บตามรูปแบบที่คุณใช้อยู่
  2. ปฏิบัติตามหลักเกณฑ์
  3. ตรวจสอบความถูกต้องของโค้ดโดยใช้การทดสอบผลการค้นหาที่เป็นริชมีเดีย และแก้ไขข้อผิดพลาดที่สําคัญทั้งหมด พิจารณาแก้ไขปัญหาที่ไม่สําคัญซึ่งอาจมีการรายงานในเครื่องมือด้วย เพราะอาจช่วยปรับปรุงคุณภาพของ Structured Data ได้ (แต่ไม่จําเป็นว่าต้องมีสิทธิ์ปรากฏในผลการค้นหาที่เป็นริชมีเดีย)
  4. ทำให้หน้าบางหน้าที่มีข้อมูลที่มีโครงสร้างใช้งานได้และใช้เครื่องมือตรวจสอบ URL เพื่อทดสอบว่า Google เห็นหน้าในลักษณะใด ตรวจสอบว่า Google เข้าถึงหน้าดังกล่าวได้และไม่มีการบล็อกหน้าด้วยไฟล์ robots.txt, แท็ก noindex หรือข้อกำหนดให้เข้าสู่ระบบ หากหน้าเว็บดูถูกต้องดีแล้ว คุณขอให้ Google ทำการ Crawl URL อีกครั้งได้
  5. หากต้องการให้ Google ทราบถึงการเปลี่ยนแปลงที่จะเกิดขึ้นในอนาคตอยู่ตลอด เราขอแนะนำให้ส่ง Sitemap ซึ่งกำหนดให้ดำเนินการแบบอัตโนมัติได้โดยใช้ Search Console Sitemap API

การลบชุดข้อมูลออกจากผลการค้นหาของ Dataset Search

หากไม่ต้องการให้ชุดข้อมูลแสดงในผลการค้นหาของ Dataset Search ให้ใช้แท็ก meta ของ robots เพื่อควบคุมวิธีจัดทำดัชนีชุดข้อมูล โปรดทราบว่าอาจใช้เวลาสักระยะ (หลายวันหรือหลายสัปดาห์ ขึ้นอยู่กับกำหนดการ Crawl) กว่าการเปลี่ยนแปลงจะสะท้อนให้เห็นใน Dataset Search

วิธีการค้นพบชุดข้อมูลของเรา

เราทำความเข้าใจ Structured Data ในหน้าเว็บเกี่ยวกับชุดข้อมูลได้โดยใช้มาร์กอัป Dataset ของ schema.org หรือโครงสร้างที่เทียบเท่าซึ่งนำเสนออยู่ในรูปแบบคำศัพท์แคตตาล็อกข้อมูล (DCAT) ของ W3C เรายังลองทดสอบการรองรับ Structured Data โดยอิงตาม W3C CSVW ด้วย และคาดว่าจะพัฒนาและปรับเปลี่ยนวิธีการของเราเมื่อมีแนวทางปฏิบัติแนะนำใหม่ๆ เกิดขึ้นสำหรับการอธิบายชุดข้อมูล ดูข้อมูลเพิ่มเติมเกี่ยวกับวิธีการค้นพบชุดข้อมูลของเราได้ที่การทำให้ค้นพบชุดข้อมูลได้ง่ายขึ้น

ตัวอย่าง

นี่คือตัวอย่างของชุดข้อมูลที่ใช้ JSON-LD และไวยากรณ์ตาม schema.org (แนะนำ) ในการทดสอบผลการค้นหาที่เป็นริชมีเดีย คำศัพท์คำเดียวกันตาม schema.org ยังใช้ในไวยากรณ์ RDFa 1.1 หรือ Microdata ได้ด้วย หรือคุณจะใช้คำศัพท์ W3C DCAT เพื่ออธิบายข้อมูลเมตาก็ได้เช่นกัน ตัวอย่างต่อไปนี้อิงตามคำอธิบายชุดข้อมูลที่มีการใช้งานจริง

JSON-LD

นี่คือตัวอย่างชุดข้อมูล JSON-LD


<html>
  <head>
    <title>NCDC Storm Events Database</title>
    <script type="application/ld+json">
    {
      "@context":"https://schema.org/",
      "@type":"Dataset",
      "name":"NCDC Storm Events Database",
      "description":"Storm Data is provided by the National Weather Service (NWS) and contain statistics on...",
      "url":"https://catalog.data.gov/dataset/ncdc-storm-events-database",
      "sameAs":"https://gis.ncdc.noaa.gov/geoportal/catalog/search/resource/details.page?id=gov.noaa.ncdc:C00510",
      "identifier": ["https://doi.org/10.1000/182",
                     "https://identifiers.org/ark:/12345/fk1234"],
      "keywords":[
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > CYCLONES",
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > DROUGHT",
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > FOG",
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > FREEZE"
      ],
      "license" : "https://creativecommons.org/publicdomain/zero/1.0/",
      "isAccessibleForFree" : true,
      "hasPart" : [
        {
          "@type": "Dataset",
          "name": "Sub dataset 01",
          "description": "Informative description of the first subdataset...",
          "license" : "https://creativecommons.org/publicdomain/zero/1.0/",
          "creator":{
             "@type":"Organization",
             "name": "Sub dataset 01 creator"
          }
        },
        {
          "@type": "Dataset",
          "name": "Sub dataset 02",
          "description": "Informative description of the second subdataset...",
          "license" : "https://creativecommons.org/publicdomain/zero/1.0/",
          "creator":{
             "@type":"Organization",
             "name": "Sub dataset 02 creator"
          }
        }
      ],
      "creator":{
         "@type":"Organization",
         "url": "https://www.ncei.noaa.gov/",
         "name":"OC/NOAA/NESDIS/NCEI > National Centers for Environmental Information, NESDIS, NOAA, U.S. Department of Commerce",
         "contactPoint":{
            "@type":"ContactPoint",
            "contactType": "customer service",
            "telephone":"+1-828-271-4800",
            "email":"ncei.orders@noaa.gov"
         }
      },
      "funder":{
         "@type": "Organization",
         "sameAs": "https://ror.org/00tgqzw13",
         "name": "National Weather Service"
      },
      "includedInDataCatalog":{
         "@type":"DataCatalog",
         "name":"data.gov"
      },
      "distribution":[
         {
            "@type":"DataDownload",
            "encodingFormat":"CSV",
            "contentUrl":"https://www.ncdc.noaa.gov/stormevents/ftp.jsp"
         },
         {
            "@type":"DataDownload",
            "encodingFormat":"XML",
            "contentUrl":"https://gis.ncdc.noaa.gov/all-records/catalog/search/resource/details.page?id=gov.noaa.ncdc:C00510"
         }
      ],
      "temporalCoverage":"1950-01-01/2013-12-18",
      "spatialCoverage":{
         "@type":"Place",
         "geo":{
            "@type":"GeoShape",
            "box":"18.0 -65.0 72.0 172.0"
         }
      }
    }
    </script>
  </head>
  <body>
  </body>
</html>
RDFa

นี่คือตัวอย่างชุดข้อมูล RDFa ที่ใช้คำศัพท์ DCAT


<article about="/node/1234" typeof="dcat:Dataset">
    <dl>
      <dt>Name:</dt>
      <dd property="dc:title">ACME Inc Cash flow data</dd>
      <dt>Identifiers:</dt>
      <dd property="dc:identifier">https://doi.org/10.1000/182</dd>
      <dd property="dc:identifier">https://identifiers.org/ark:/12345/fk1234</dd>
      <dt>Description:</dt>
      <dd property="dc:description">Financial Statements - Consolidated Statement of Cash Flows</dd>
      <dt>Category:</dt>
      <dd rel="dc:subject">Financial</dd>
      <dt class="field-label">Downloads:</dt>
      <dd>
        <ul>
          <li>
            <a rel="dcat:distribution" href="Consolidated_Statement_of_Cash_Flows_en.csv"><span property="dcat:mediaType" content="text/csv" >Consolidated_Statement_of_Cash_Flows_en.csv</span></a>
          </li>
         <li>
            <a rel="dcat:distribution"  href="files/Consolidated_Statement_of_Cash_Flows_en.xls"><span property="dcat:mediaType" content="application/vnd.ms-excel">Consolidated_Statement_of_Cash_Flows_en.xls</span></a>
          </li>
          <li>
            <a rel="dcat:distribution"  href="files/consolidated_statement_of_cash_flows_en.xml"><span property="dcat:mediaType" content="application/xml">consolidated_statement_of_cash_flows_en.xml</span></a>
          </li>
        </ul>
      </dd>
    </dl>
  </article>

หลักเกณฑ์

เว็บไซต์ต้องเป็นไปตามหลักเกณฑ์เกี่ยวกับ Structured Data นอกจากหลักเกณฑ์เกี่ยวกับ Structured Data แล้ว เราขอแนะนำให้ทำตามแนวทางปฏิบัติแนะนำสำหรับแผนผังเว็บไซต์และแหล่งที่มาและต้นทางด้วย

แนวทางปฏิบัติแนะนำเกี่ยวกับแผนผังเว็บไซต์

โปรดใช้ไฟล์แผนผังเว็บไซต์เพื่อช่วยให้ Google พบ URL ของคุณ การใช้ไฟล์แผนผังเว็บไซต์และมาร์กอัป sameAs ช่วยบันทึกวิธีเผยแพร่คำอธิบายชุดข้อมูลทั่วทุกที่ในเว็บไซต์ของคุณ

หากคุณมีที่เก็บชุดข้อมูล เป็นไปได้ว่าคุณมีหน้า Canonical ("Landing Page") อย่างน้อย 2 ประเภทสำหรับชุดข้อมูลแต่ละชุดและหน้าที่แสดงรายการชุดข้อมูลหลายรายการ (เช่น ผลการค้นหาหรือชุดข้อมูลบางชุด) เราขอแนะนำให้คุณเพิ่ม Structured Data เกี่ยวกับชุดข้อมูลลงในหน้า Canonical ใช้พร็อพเพอร์ตี้ sameAs เพื่อลิงก์หน้า Canonical หากคุณเพิ่ม Structured Data ลงในสำเนาชุดข้อมูลหลายสำเนา เช่น ข้อมูลในหน้าผลการค้นหา

แนวทางปฏิบัติแนะนำเกี่ยวกับแหล่งที่มาและต้นทาง

ชุดข้อมูลแบบเปิดอาจมีการเผยแพร่ต่อ การรวม และการอิงตามชุดข้อมูลอื่นๆ เป็นเรื่องปกติ นี่คือข้อมูลสรุปเบื้องต้นเกี่ยวกับวิธีการนำเสนอสถานการณ์ที่ชุดข้อมูลหนึ่งอิงตามหรือเป็นสำเนาของชุดข้อมูลอื่น

  • ใช้พร็อพเพอร์ตี้ sameAs เพื่อระบุ Canonical URL ที่ตรงกันมากที่สุดของต้นฉบับในกรณีที่ชุดข้อมูลหรือคำอธิบายเป็นเพียงการเผยแพร่ซ้ำเนื้อหาที่เผยแพร่ไว้ที่อื่น ค่าของ sameAs ต้องระบุตัวตนของชุดข้อมูลอย่างชัดเจน กล่าวคือ ไม่ใช้ค่า sameAs เดียวกันสำหรับชุดข้อมูล 2 ชุดที่แตกต่างกัน
  • ใช้พร็อพเพอร์ตี้ isBasedOn ในกรณีที่ชุดข้อมูลที่เผยแพร่ซ้ำ (รวมถึงข้อมูลเมตา) มีการเปลี่ยนแปลงไปอย่างมาก
  • เมื่อชุดข้อมูลดัดแปลงมาจากหรือรวมมาจากต้นฉบับหลายรายการ ให้ใช้พร็อพเพอร์ตี้ isBasedOn
  • ใช้พร็อพเพอร์ตี้ identifier เพื่อแนบ Digital Object Identifier (DOI) หรือ Compact Identifier ใดก็ตามที่เกี่ยวข้อง ถ้าชุดข้อมูลมีตัวระบุมากกว่า 1 ตัว ให้ใช้พร็อพเพอร์ตี้ identifier ซ้ำ หากใช้ JSON-LD ระบบจะแสดงโดยใช้รูปแบบรายการ JSON

เราต้องการปรับปรุงคำแนะนำของเราโดยอิงตามความคิดเห็น โดยเฉพาะอย่างยิ่งในเรื่องคำอธิบายต้นทาง การกำหนดเวอร์ชัน และวันที่ที่เชื่อมโยงกับการเผยแพร่ตามอนุกรมเวลา โปรดเข้าร่วมในการสนทนาของชุมชน

คำแนะนำพร็อพเพอร์ตี้แบบข้อความ

เราขอแนะนำให้จำกัดพร็อพเพอร์ตี้แบบข้อความทั้งหมดไว้ไม่เกิน 5,000 อักขระ Google Dataset Search จะใช้เพียง 5,000 อักขระแรกของพร็อพเพอร์ตี้แบบข้อความแต่ละรายการ โดยปกติชื่อกับหัวข้อจะเป็นประโยคสั้นๆ หรือมีเพียงไม่กี่คำ

ข้อผิดพลาดและคำเตือนที่ทราบ

คุณอาจพบข้อผิดพลาดหรือคำเตือนในการทดสอบผลการค้นหาที่เป็นริชมีเดียของ Google และระบบตรวจสอบความถูกต้องอื่นๆ กล่าวอย่างเจาะจงคือ ระบบตรวจสอบความถูกต้องอาจชี้แนะว่าองค์กรต้องมีข้อมูลติดต่อ ซึ่งรวมถึง contactType ในกรณีนี้ค่าที่เป็นประโยชน์ ได้แก่ customer service, emergency, journalist, newsroom และ public engagement และคุณไม่จำเป็นต้องสนใจข้อผิดพลาดที่ csvw:Table เป็นค่าที่ไม่คาดคิดของพร็อพเพอร์ตี้ mainEntity ด้วย

คำจำกัดความของประเภท Structured Data

คุณต้องใส่พร็อพเพอร์ตี้ที่จำเป็นลงในเนื้อหาเพื่อให้มีสิทธิ์แสดงเป็นผลการค้นหาที่เป็นริชมีเดีย คุณอาจใส่พร็อพเพอร์ตี้ที่แนะนำด้วยเพื่อให้ข้อมูลเพิ่มเติมเกี่ยวกับเนื้อหา ซึ่งจะช่วยให้ผู้ใช้ได้รับประสบการณ์ที่ดียิ่งขึ้น

คุณใช้การทดสอบผลการค้นหาที่เป็นริชมีเดียเพื่อตรวจสอบความถูกต้องของมาร์กอัปได้

สิ่งสำคัญคือการอธิบายข้อมูลเกี่ยวกับชุดข้อมูล (ข้อมูลเมตา) และการนำเสนอเนื้อหา เช่น ข้อมูลเมตาของชุดข้อมูลจะบอกว่าชุดข้อมูลนั้นเกี่ยวกับอะไร ตัวแปรที่วัดมีอะไรบ้าง ใครเป็นผู้สร้างชุดข้อมูล และอื่นๆ แต่จะไม่มีค่าที่เจาะจงของตัวแปร เป็นต้น

Dataset

ดูคำจำกัดความที่สมบูรณ์ของ Dataset ได้ที่ schema.org/Dataset

คุณบรรยายข้อมูลเพิ่มเติมเกี่ยวกับสิ่งพิมพ์ของชุดข้อมูลได้ เช่น ใบอนุญาต, เวลาที่เผยแพร่, DOI ของชุดข้อมูล หรือ sameAs ที่ชี้ไปยังเวอร์ชัน Canonical ของชุดข้อมูลในที่เก็บอื่น ใส่ identifier, license และ sameAs สำหรับชุดข้อมูลที่มีต้นทางและข้อมูลใบอนุญาต

พร็อพเพอร์ตี้ที่ Google รองรับมีดังต่อไปนี้

พร็อพเพอร์ตี้ที่จำเป็น
description Text

สรุปสั้นๆ ที่อธิบายเกี่ยวกับชุดข้อมูล

หลักเกณฑ์

  • สรุปต้องมีความยาวระหว่าง 50 ถึง 5,000 อักขระ
  • ในสรุปอาจใส่ไวยากรณ์ Markdown ด้วยก็ได้ รูปภาพที่ฝังจะต้องใช้เส้นทาง URL แบบสัมบูรณ์ (ไม่ใช่เส้นทางแบบสัมพัทธ์)
  • เมื่อใช้รูปแบบ JSON-LD ให้แสดงบรรทัดใหม่ด้วย \n (มีอักขระ 2 ตัวคือ แบ็กสแลชและอักษร "n" ตัวพิมพ์เล็ก)
name Text

ชื่อที่สื่อความหมายของชุดข้อมูล เช่น "ความลึกของหิมะในซีกโลกเหนือ"

หลักเกณฑ์

  • ใช้ชื่อที่ไม่ซ้ำกันสำหรับชุดข้อมูลที่แตกต่างกันเมื่อใดก็ตามที่ทำได้
  • แนะนำ: "Snow depth in the Northern Hemisphere" และ "Snow depth in the Southern Hemisphere" สำหรับชุดข้อมูล 2 ชุดที่แตกต่างกัน

    ไม่แนะนำ: "Snow depth" และ "Snow depth" สําหรับชุดข้อมูล 2 ชุดที่แตกต่างกัน

พร็อพเพอร์ตี้ที่แนะนำ
alternateName Text

ชื่ออื่นที่ใช้เพื่ออ้างถึงชุดข้อมูลนี้ เช่น ชื่อแทนหรือคำย่อ ตัวอย่าง (ในรูปแบบ JSON-LD)

"name": "The Quick, Draw! Dataset"
"alternateName": ["Quick Draw Dataset", "quickdraw-dataset"]
creator Person หรือ Organization

ผู้สร้างหรือผู้เขียนชุดข้อมูลนี้ ใช้ ORCID ID เป็นค่าของพร็อพเพอร์ตี้ sameAs ประเภท Person เพื่อระบุตัวตนของบุคคลโดยไม่ซ้ำ ใช้ ROR ID เพื่อระบุสถาบันและองค์กรโดยไม่ซ้ำ ตัวอย่าง (ในรูปแบบ JSON-LD)

"creator": [
  {
    "@type": "Person",
    "sameAs": "https://orcid.org/0000-0000-0000-0000",
    "givenName": "Jane",
    "familyName": "Foo",
    "name": "Jane Foo"
  },
  {
    "@type": "Person",
    "sameAs": "https://orcid.org/0000-0000-0000-0001",
    "givenName": "Jo",
    "familyName": "Bar",
    "name": "Jo Bar"
  },
  {
    "@type": "Organization",
    "sameAs": "https://ror.org/xxxxxxxxx",
    "name": "Fictitious Research Consortium"
  }
]
citation Text หรือ CreativeWork

ระบุบทความทางวิชาการที่ผู้ให้ข้อมูลแนะนำให้อ้างอิงนอกเหนือจากตัวชุดข้อมูล ระบุการอ้างอิงสำหรับชุดข้อมูลด้วยพร็อพเพอร์ตี้อื่น เช่น name, identifier, creator และ publisher ตัวอย่างเช่น พร็อพเพอร์ตี้นี้ระบุสิ่งพิมพ์ทางวิชาการที่เกี่ยวข้องโดยเฉพาะ เช่น ข้อบ่งชี้ข้อมูล เอกสารข้อมูล หรือบทความที่ชุดข้อมูลนี้เป็นส่วนเสริมให้ ตัวอย่าง (ในรูปแบบ JSON-LD)

"citation": "https://doi.org/10.1111/111"
"citation": "https://identifiers.org/pubmed:11111111"
"citation": "https://identifiers.org/arxiv:0111.1111v1"
"citation":
 "Doe J (2014) Influence of X ... https://doi.org/10.1111/111"

หลักเกณฑ์เพิ่มเติม

  • อย่าใช้พร็อพเพอร์ตี้นี้สำหรับให้ข้อมูลการอ้างอิงของชุดข้อมูลนั้น ช่องนี้ใช้สำหรับระบุบทความทางวิชาการที่เกี่ยวข้องไม่ใช่ตัวชุดข้อมูลเอง หากต้องการให้ข้อมูลที่จำเป็นสำหรับการอ้างอิงชุดข้อมูลนั้น ให้ใช้พร็อพเพอร์ตี้ name, identifier, creator และ publisher แทน
  • เมื่อใส่ข้อมูลโค้ดในพร็อพเพอร์ตี้อ้างอิง ให้ใส่ตัวระบุบทความ (เช่น DOI) ทุกครั้งที่ทำได้

    แนะนำ: "Doe J (2014) Influence of X. Biomics 1(1). https://doi.org/10.1111/111"

    ไม่แนะนำ: "Doe J (2014) Influence of X. Biomics 1(1)."

funder Person หรือ Organization

บุคคลหรือองค์กรที่ให้การสนับสนุนด้านการเงินสําหรับชุดข้อมูลนี้ ใช้ ORCID ID เป็นค่าของพร็อพเพอร์ตี้ sameAs ประเภท Person เพื่อระบุตัวตนของบุคคลโดยไม่ซ้ำ ใช้ ROR ID เพื่อระบุสถาบันและองค์กรโดยไม่ซ้ำ ตัวอย่าง (ในรูปแบบ JSON-LD)

"funder": [
  {
    "@type": "Person",
    "sameAs": "https://orcid.org/0000-0000-0000-0002",
    "givenName": "Jane",
    "familyName": "Funder",
    "name": "Jane Funder"
  },
  {
    "@type": "Organization",
    "sameAs": "https://ror.org/yyyyyyyyy",
    "name": "Fictitious Funding Organization"
  }
]
hasPart หรือ isPartOf URL หรือ Dataset

หากชุดข้อมูลนั้นเป็นการรวบรวมชุดข้อมูลขนาดเล็กไว้ด้วยกัน ให้ใช้พร็อพเพอร์ตี้ hasPart เพื่อแสดงความสัมพันธ์ดังกล่าว ในทางกลับกัน ถ้าชุดข้อมูลนั้นเป็นส่วนหนึ่งของชุดข้อมูลที่มีขนาดใหญ่กว่า ให้ใช้ isPartOf พร็อพเพอร์ตี้ทั้งสองจะอยู่ในรูปแบบ URL หรืออินสแตนซ์ Dataset ก็ได้ ในกรณีที่ใช้ Dataset เป็นค่าหนึ่ง ก็จะต้องรวมพร็อพเพอร์ตี้ทั้งหมดที่จำเป็นสำหรับ Dataset ที่ใช้งานเดี่ยวๆ ตัวอย่าง

"hasPart" : [
  {
    "@type": "Dataset",
    "name": "Sub dataset 01",
    "description": "Informative description of the first subdataset...",
    "license": "https://creativecommons.org/publicdomain/zero/1.0/",
    "creator": {
      "@type":"Organization",
      "name": "Sub dataset 01 creator"
    }
  },
  {
    "@type": "Dataset",
    "name": "Sub dataset 02",
    "description": "Informative description of the second subdataset...",
    "license": "https://creativecommons.org/publicdomain/zero/1.0/",
    "creator": {
      "@type":"Organization",
      "name": "Sub dataset 02 creator"
    }
  }
]
"isPartOf" : "https://example.com/aggregate_dataset"
identifier URL, Text หรือ PropertyValue

ตัวระบุ เช่น DOI หรือ Compact Identifier ถ้าชุดข้อมูลมีตัวระบุมากกว่า 1 ตัว ให้ใช้พร็อพเพอร์ตี้ identifier ซ้ำ หากใช้ JSON-LD ระบบจะแสดงโดยใช้รูปแบบรายการ JSON

isAccessibleForFree Boolean

ชุดข้อมูลเข้าถึงโดยไม่ต้องชำระเงินหรือไม่

keywords Text

คีย์เวิร์ดที่สรุปชุดข้อมูล

license URL หรือ CreativeWork

ใบอนุญาตการเผยแพร่ของชุดข้อมูล เช่น

"license" : "https://creativecommons.org/publicdomain/zero/1.0/"
"license" : {
  "@type": "CreativeWork",
  "name": "Custom license",
  "url": "https://example.com/custom_license"
  }

หลักเกณฑ์เพิ่มเติม

  • ระบุ URL ที่บอกเวอร์ชันของใบอนุญาตที่ใช้อย่างชัดเจน

    แนะนำ

    "license" : "https://creativecommons.org/licenses/by/4.0"

    ไม่แนะนำ

    "license" : "https://creativecommons.org/licenses/by"
measurementTechnique Text หรือ URL

เทคนิค เทคโนโลยี หรือระเบียบวิธีที่ใช้ในชุดข้อมูล ซึ่งสอดคล้องกับตัวแปรที่อธิบายไว้ใน variableMeasured

sameAs URL

URL ของหน้าเว็บอ้างอิงที่ระบุตัวตนของชุดข้อมูลอย่างชัดเจน

spatialCoverage Text หรือ Place

คุณอาจระบุจุดจุดเดียวที่อธิบายแง่มุมด้านตำแหน่งของชุดข้อมูล โปรดระบุพร็อพเพอร์ตี้นี้เมื่อชุดข้อมูลมีมิติข้อมูลเกี่ยวกับตำแหน่งเท่านั้น เช่น จุดจุดเดียวที่มีการรวบรวมการวัดทั้งหมด หรือพิกัดของกรอบพื้นที่

จุด

"spatialCoverage:" {
  "@type": "Place",
  "geo": {
    "@type": "GeoCoordinates",
    "latitude": 39.3280,
    "longitude": 120.1633
  }
}

รูปทรง

โปรดใช้ GeoShape เพื่ออธิบายพื้นที่ที่มีรูปทรงต่างๆ เช่น การระบุกรอบพื้นที่

"spatialCoverage:" {
  "@type": "Place",
  "geo": {
    "@type": "GeoShape",
    "box": "39.3280 120.1633 40.445 123.7878"
  }
}

จุดในพร็อพเพอร์ตี้ box, circle, line หรือ polygon ต้องใช้การเว้นวรรคสำหรับแยกค่า 2 ค่าตามละติจูดและลองจิจูด (ตามลำดับนั้น)

สถานที่ที่มีชื่อ

"spatialCoverage:" "Tahoe City, CA"
temporalCoverage Text

ข้อมูลในชุดข้อมูลครอบคลุมช่วงเวลาที่เจาะจง โปรดระบุพร็อพเพอร์ตี้นี้เมื่อชุดข้อมูลมีมิติข้อมูลเวลาเท่านั้น Schema.org ใช้มาตรฐาน ISO 8601 เพื่ออธิบายช่วงเวลาและจุดเวลา คุณอธิบายวันที่ในแบบต่างๆ ได้โดยขึ้นอยู่กับช่วงเวลาของชุดข้อมูล โปรดระบุช่วงเวลาปลายเปิดด้วยจุดทศนิยม 2 จุด (..)

วันเดียว

"temporalCoverage" : "2008"

ระยะเวลา

"temporalCoverage" : "1950-01-01/2013-12-18"

ระยะเวลาปลายเปิด

"temporalCoverage" : "2013-12-19/.."
variableMeasured Text หรือ PropertyValue

ตัวแปรที่ชุดข้อมูลนี้วัด เช่น อุณหภูมิหรือแรงดัน

version Text หรือ Number

หมายเลขเวอร์ชันของชุดข้อมูล

url URL

ตำแหน่งของหน้าที่อธิบายชุดข้อมูล

DataCatalog

ดูคำจำกัดความที่สมบูรณ์ของ DataCatalog ได้ที่ schema.org/DataCatalog

ชุดข้อมูลมักจะเผยแพร่ในที่เก็บที่มีชุดข้อมูลอื่นๆ อีกมากมาย ชุดข้อมูลเดียวกันอาจรวมอยู่ในที่เก็บดังกล่าวมากกว่า 1 ที่ คุณอ้างถึงแคตตาล็อกข้อมูลที่มีชุดข้อมูลนี้อยู่ได้โดยการอ้างอิงแคตตาล็อกโดยตรงโดยใช้พร็อพเพอร์ตี้ต่อไปนี้

พร็อพเพอร์ตี้ที่แนะนำ
includedInDataCatalog DataCatalog

แคตตาล็อกที่มีชุดข้อมูลนั้นอยู่

DataDownload

ดูคำจำกัดความที่สมบูรณ์ของ DataDownload ได้ที่ schema.org/DataDownload นอกเหนือจากพร็อพเพอร์ตี้ Dataset แล้ว โปรดเพิ่มพร็อพเพอร์ตี้ต่อไปนี้สำหรับชุดข้อมูลที่มีตัวเลือกในการดาวน์โหลดด้วย

พร็อพเพอร์ตี้ distribution อธิบายวิธีดูชุดข้อมูลเพราะ URL มักจะชี้ไปที่หน้า Landing Page ที่อธิบายชุดข้อมูล พร็อพเพอร์ตี้ distribution อธิบายตำแหน่งและรูปแบบของข้อมูล พร็อพเพอร์ตี้นี้อาจมีค่าหลายรายการ เช่น เวอร์ชัน CSV มี URL เดียวและเวอร์ชัน Excel อยู่ที่ URL อื่น

พร็อพเพอร์ตี้ที่จำเป็น
distribution.contentUrl URL

ลิงก์สำหรับการดาวน์โหลด

พร็อพเพอร์ตี้ที่แนะนำ
distribution DataDownload

คำอธิบายตำแหน่งของการดาวน์โหลดชุดข้อมูลและรูปแบบไฟล์สำหรับการดาวน์โหลด

distribution.encodingFormat Text หรือ URL

รูปแบบไฟล์ของการเผยแพร่

ชุดข้อมูลแบบตาราง

ชุดข้อมูลแบบตารางคือชุดข้อมูลที่จัดระเบียบเป็นตารางที่มีแถวและคอลัมน์เป็นหลัก สำหรับหน้าที่ฝังชุดข้อมูลแบบตาราง คุณยังสร้างมาร์กอัปที่ชัดเจนยิ่งขึ้นได้ด้วย โดยต่อยอดจากวิธีการพื้นฐาน ขณะนี้เราเข้าใจ CSVW ("CSV ในเว็บ" โปรดดู W3C) รูปแบบต่างๆ ที่ระบุพร้อมกันกับเนื้อหาแบบตารางสำหรับผู้ใช้ในหน้า HTML

ต่อไปนี้คือตัวอย่างที่แสดงตารางขนาดเล็กที่เข้ารหัสในรูปแบบ CSVW JSON-LD มีข้อผิดพลาดที่ทราบบางอย่างในการทดสอบผลการค้นหาที่เป็นริชมีเดีย


<html>
  <head>
    <title>American Humane Association</title>
    <script type="application/ld+json">
    {
      "@context": ["https://schema.org", {"csvw": "https://www.w3.org/ns/csvw#"}],
      "@type": "Dataset",
      "name":"AMERICAN HUMANE ASSOCIATION",
      "description": "ProPublica's Nonprofit Explorer lets you view summaries of 2.2 million tax returns from tax-exempt organizations and see financial details such as their executive compensation and revenue and expenses. You can browse raw IRS data released since 2013 and access over 9.4 million tax filing documents going back as far as 2001.",
      "publisher": {
        "@type": "Organization",
        "name": "ProPublica"
      },
      "mainEntity" : {
        "@type" : "csvw:Table",
        "csvw:tableSchema": {
          "csvw:columns": [
            {
              "csvw:name": "Year",
              "csvw:datatype": "string",
              "csvw:cells": [
                {
                  "csvw:value": "2024",
                  "csvw:primaryKey": "2024"
                },
                {
                  "csvw:value": "2024",
                  "csvw:primaryKey": "2024"
                }]
            },
            {
              "csvw:name": "Organization name",
              "csvw:datatype": "string",
              "csvw:cells": [
                {
                  "csvw:value": "AMERICAN HUMANE ASSOCIATION",
                  "csvw:primaryKey": "2024"
                },
                {
                  "csvw:value": "AMERICAN HUMANE ASSOCIATION",
                  "csvw:primaryKey": "2024"
                }]
            },
            {
              "csvw:name": "Organization address",
              "csvw:datatype": "string",
              "csvw:cells": [
                {
                  "csvw:value": "1400 16TH STREET NW",
                  "csvw:primaryKey": "2024"
                },
                {
                  "csvw:value": "1400 16TH STREET NW",
                  "csvw:primaryKey": "2024"
                }]
            },
            {
              "csvw:name": "Organization NTEE Code",
              "csvw:datatype": "string",
              "csvw:cells": [
                {
                  "csvw:value": "D200",
                  "csvw:notes": "Animal Protection and Welfare",
                  "csvw:primaryKey": "2024"
                },
                {
                  "csvw:value": "D200",
                  "csvw:notes": "Animal Protection and Welfare",
                  "csvw:primaryKey": "2024"
                }]
            },
            {
              "csvw:name": "Total functional expenses ($)",
              "csvw:datatype": "integer",
              "csvw:cells": [
                {
                  "csvw:value": "13800212",
                  "csvw:primaryKey": "2024"
                },
                {
                  "csvw:value": "13800212",
                  "csvw:primaryKey": "2024"
                }]
            }]
        }
      }
    }
    </script>
  </head>
  <body>
  </body>
</html>

ตรวจสอบผลการค้นหาที่เป็นสื่อสมบูรณ์ด้วย Search Console

Search Console เป็นเครื่องมือที่ช่วยในการตรวจสอบประสิทธิภาพของหน้าเว็บใน Google Search คุณไม่จำเป็นต้องลงชื่อสมัครใช้ Search Console เพื่อให้เนื้อหาได้แสดงในผลการค้นหาของ Google แต่การลงชื่อสมัครใช้จะช่วยให้คุณเข้าใจและปรับปรุงวิธีที่ Google เห็นเว็บไซต์ได้ เราขอแนะนำให้ไปดูข้อมูลใน Search Console ในกรณีต่อไปนี้

  1. หลังจากทำให้ข้อมูลที่มีโครงสร้างใช้งานได้เป็นครั้งแรก
  2. หลังจากเผยแพร่เทมเพลตใหม่หรืออัปเดตโค้ด
  3. วิเคราะห์การเข้าชมเป็นระยะ

หลังจากทำให้ข้อมูลที่มีโครงสร้างใช้งานได้เป็นครั้งแรก

หลังจากที่ Google ได้จัดทำดัชนีหน้าของคุณแล้ว ให้ตรวจหาปัญหาโดยใช้รายงานสถานะผลการค้นหาที่เป็นสื่อสมบูรณ์ที่เกี่ยวข้อง ตามหลักแล้ว รายการที่ถูกต้องควรจะมีจํานวนเพิ่มขึ้น และรายการที่ไม่ถูกต้องไม่ควรจะมีจำนวนเพิ่มขึ้น หากพบปัญหาในข้อมูลที่มีโครงสร้าง ให้ทำดังนี้

  1. แก้ไขรายการที่ไม่ถูกต้อง
  2. ตรวจสอบ URL ที่เผยแพร่เพื่อดูว่ายังมีปัญหาอยู่หรือไม่
  3. ขอการตรวจสอบโดยใช้รายงานสถานะ

หลังจากเผยแพร่เทมเพลตใหม่หรืออัปเดตโค้ด

เมื่อทําการเปลี่ยนแปลงที่สําคัญในเว็บไซต์ ให้คอยตรวจสอบการเพิ่มขึ้นของรายการที่ไม่ถูกต้องของ Structured Data
  • หากเห็นว่าจำนวนรายการที่ไม่ถูกต้องเพิ่มขึ้น อาจเป็นเพราะคุณเผยแพร่เทมเพลตใหม่ที่ใช้งานไม่ได้ หรือเว็บไซต์โต้ตอบกับเทมเพลตที่มีอยู่ด้วยวิธีใหม่และไม่ถูกต้อง
  • หากเห็นว่าจำนวนรายการที่ถูกต้องลดลง (ไม่สอดคล้องกับรายการที่ถูกต้องซึ่งเพิ่มขึ้น) บางทีอาจเป็นเพราะคุณไม่ได้ฝัง Structured Data ไว้ในหน้าอีกแล้ว ให้ใช้เครื่องมือตรวจสอบ URL เพื่อดูสาเหตุของปัญหา

วิเคราะห์การเข้าชมเป็นระยะ

วิเคราะห์การเข้าชมจาก Google Search โดยใช้รายงานประสิทธิภาพ ข้อมูลจะแสดงความถี่ที่หน้าปรากฏเป็นผลการค้นหาที่เป็นสื่อสมบูรณ์ใน Search ความถี่ที่ผู้ใช้คลิกหน้า และอันดับเฉลี่ยที่หน้าปรากฏในผลการค้นหา คุณจะใช้ Search Console API ดึงผลการค้นหาเหล่านี้โดยอัตโนมัติก็ได้เช่นกัน

การแก้ปัญหา

หากประสบปัญหาในการใช้หรือแก้ไขข้อบกพร่องของ Structured Data โปรดดูแหล่งข้อมูลต่อไปนี้ซึ่งอาจช่วยคุณได้

ชุดข้อมูลที่เฉพาะเจาะจงไม่แสดงในผลการค้นหาของ Dataset Search

สาเหตุของปัญหา: เว็บไซต์ของคุณไม่มี Structured Data ในหน้าเว็บที่อธิบายชุดข้อมูลนั้น หรือยังไม่มีการทำการ Crawl หน้าเว็บนั้น

แก้ปัญหา

  1. คัดลอกลิงก์ของหน้าที่คุณคาดว่าจะเห็นในผลการค้นหาของ Dataset Search และใส่ไว้ในการทดสอบผลการค้นหาที่เป็นริชมีเดีย หากข้อความ "หน้าเว็บไม่มีสิทธิ์แสดงเป็นผลการค้นหาที่เป็นริชมีเดียตามที่การทดสอบนี้ทราบ" หรือ "มาร์กอัปบางรายการไม่มีสิทธิ์แสดงเป็นผลการค้นหาที่เป็นริชมีเดีย" ปรากฏขึ้น แสดงว่าไม่มีมาร์กอัปชุดข้อมูลในหน้านั้นหรือมีแต่ไม่ถูกต้อง คุณดูวิธีแก้ไขได้ที่ส่วนวิธีเพิ่ม Structured Data
  2. หากมีมาร์กอัปในหน้านั้น แสดงว่าอาจยังไม่มีการทำการ Crawl คุณตรวจสอบสถานะการทำการ Crawl ได้ด้วย Search Console

โลโก้บริษัทหายไปหรือไม่ปรากฏอย่างถูกต้องในผลการค้นหา

สาเหตุของปัญหา: หน้าเว็บอาจไม่มีมาร์กอัปตาม schema.org สำหรับโลโก้ขององค์กร หรือไม่มีข้อมูลธุรกิจของคุณใน Google

แก้ปัญหา

  1. เพิ่ม Structured Data สำหรับโลโก้ลงในหน้าเว็บ
  2. ระบุรายละเอียดทางธุรกิจให้ Google ทราบ