נתוני הכבישים המצטברים מסופקים כנתונים של פעולות על ציר הזמן, שכוללים:
- משך הנסיעה
- מרווחי זמן לקריאה מהירה (SRI)
- גיאומטריית המסלול
הגדרת BigQuery
כדי לגשת לנתוני הכבישים ב-BigQuery, צריך להגדיר את פרויקט Google Cloud ולהירשם ל-Data Exchange.
דרישות מוקדמות
מוודאים שהפרויקט והחשבון שלכם ב-Google Cloud כוללים את ההגדרות הבאות:
- מפעילים את BigQuery API. הוראות מפורטות זמינות במאמר בנושא הפעלת שאילתה במערך נתונים ציבורי באמצעות מסוף Google Cloud.
- מפעילים את Analytics Hub API. Analytics Hub API
- הקצאת התפקידים הנדרשים ב-IAM. כדי לבצע משימות שקשורות למנויים וליצור מערכי נתונים, צריך לוודא שיש בחשבון את התפקידים הבאים:
- מנוי ל-Analytics Hub
(
roles/analyticshub.subscriber)- משתמש BigQuery
(
roles/bigquery.user)
- משתמש BigQuery
(
הרשמה לאוסף הנתונים לשיתוף
הנתונים על הכבישים משותפים איתכם באמצעות חילופי נתונים פרטיים ב-BigQuery (מרכז Analytics). כדי לגשת לנתונים, תקבלו קישור ספציפי להרשמה משותף של Google. מערך הנתונים הזה עומד במוסכמת השמות הבאה:
historical_roads_data_PROJECT_NUMBER.
כדי להירשם לנתונים שלכם:
- לוחצים על קישור ההרשמה שסופק על ידי שותף Google. הקישור הזה יעביר אתכם ישירות לאוסף נתונים לשיתוף במסוף Google Cloud.
- בודקים את פרטי חילופי הנתונים במסוף Google Cloud.
- לוחצים על הלחצן Subscribe (הרשמה) בתיבת הדו-שיח.
- כשהמינוי מסתיים, מערך הנתונים המקושר מופיע בחלונית Explorer של BigQuery במסוף Google Cloud. מעכשיו אפשר להשתמש בשמות הטבלאות שמופיעים בחלונית 'סייר' כדי לגשת לנתונים בשאילתות SQL.
טבלאות ב-BigQuery
נתוני הכבישים המצטברים של המסלולים שבחרתם מאוחסנים במערך נתונים מבודד ב-BigQuery של פרויקט בענן בבעלות Google. הוא משותף איתכם באמצעות בורסת נתונים פרטית שנוצרה במיוחד בשבילכם בשיתוף BigQuery (מרכז Analytics). כדי לגשת לנתונים, צריך להירשם ל-Data Exchange וליצור מערך נתונים מקושר בפרויקט Google Cloud.
מערך הנתונים המשותף ב-BigQuery כולל כמה טבלאות ב-BigQuery שמוגדרות ונוצרות על ידי Google. בטבלה הבאה מפורטים הנתונים של כל טבלה.
טבלה של historical_travel_time
זו הסכימה של טבלת BigQuery historical_travel_time:
| שם | מצב | סוג | תיאור |
|---|---|---|---|
| selected_route_id | יכול להיות ריק | מחרוזת | selected_route_id של המסלול |
| השם_המוצג | יכול להיות ריק | מחרוזת | השם המוצג של המסלול |
| record_time | יכול להיות ריק | חותמת זמן | חותמת הזמן שבה מחושבים נתוני המסלול |
| duration_in_seconds | יכול להיות ריק | מספר ממשי (float) | משך המסלול עם התחשבות בעומסי התנועה |
| static_duration_in_seconds | יכול להיות ריק | מספר ממשי (float) | משך המסלול בלי להתחשב בתנועה |
| route_geometry | יכול להיות ריק | GEOGRAPHY | הגיאומטריה של הקו הפוליגוני של המסלול, שמתחשבת בתנועה |
התנהגויות ועובדות שקשורות לטבלאות
- הטבלה מחולקת למחיצות לפי יום, וכל מחיצה מוגדרת עם תפוגה של 10 שנים.
- הטבלה מתעדכנת מדי שעה עם נתוני התנועה האחרונים שנכתבים בחבילות.
- אחרי שיוצרים נתיב חדש ב-Roads Selection API, צריך להמתין עד שעה אחת עד שהנתונים יהיו זמינים בטבלה הזו.
- אחרי שמסלול נמחק מ-Roads Selection API, לא נכתבים נתונים חדשים בטבלה הזו לגבי המסלול. עם זאת, הנתונים ההיסטוריים נשארים עד לתפוגה.
טבלה של recent_roads_data
הערה: הטבלה הזו זמינה רק אם החוזה שלכם כולל נתוני כבישים בזמן אמת.
בניגוד לטבלה historical_travel_time, הטבלה הזו מכילה גם נתונים של SpeedReadingInterval. זו הסכימה ב-BigQuery:
| שם | מצב | סוג | תיאור |
|---|---|---|---|
| selected_route_id | יכול להיות ריק | מחרוזת | selected_route_id של המסלול |
| השם_המוצג | יכול להיות ריק | מחרוזת | השם המוצג של המסלול |
| record_time | יכול להיות ריק | חותמת זמן | חותמת הזמן שבה מחושבים נתוני המסלול |
| duration_in_seconds | יכול להיות ריק | מספר ממשי (float) | משך המסלול עם התחשבות בעומסי התנועה |
| static_duration_in_seconds | יכול להיות ריק | מספר ממשי (float) | משך המסלול בלי להתחשב בתנועה |
| route_geometry | יכול להיות ריק | GEOGRAPHY | הגיאומטריה של הקו הפוליגוני של המסלול, שמתחשבת בתנועה |
| speed_reading_intervals | מרובה ערכים | רשומה | מרווחי זמן שמייצגים את צפיפות התנועה לאורך המסלול. אפשר לראות את ההגדרה המקורית ב-Routes API |
| speed_reading_intervals.interval_coordinates | מרובה ערכים | GEOGRAPHY | הגיאומטריה של המרווח הזה |
| speed_reading_intervals.speed | יכול להיות ריק | מחרוזת | סיווג המהירות במרווח הזמן הזה. ערכים אפשריים: NORMAL, SLOW, TRAFFIC_JAM |
התנהגויות ועובדות שקשורות לטבלאות
- הטבלה מחולקת למחיצות לפי יום, וכל מחיצה מוגדרת עם תוקף של 60 יום.
- הטבלה מתעדכנת מדי שעה עם נתוני התנועה האחרונים שנכתבים בחבילות.
- אחרי שיוצרים נתיב חדש ב-Roads Selection API, צריך להמתין עד שעה אחת עד שהנתונים יהיו זמינים בטבלה הזו.
- אחרי שמסלול נמחק מ-Roads Selection API, לא ייכתבו יותר נתונים חדשים בטבלה הזו לגבי המסלול. עם זאת, הנתונים ההיסטוריים נשארים עד לתפוגה.
טבלה של routes_status
בטבלה מופיעים המטא-נתונים של המסלולים שנבחרו ופרטי הסטטוס שלהם. המטרה היא לספק דרך קלה יותר לצפייה בכל המסלולים והסטטוסים. אפשר לצרף אותה לשתי הטבלאות האחרות כדי לסנן את הנתונים. זו הסכימה ב-BigQuery:
| שם | מצב | סוג | תיאור |
|---|---|---|---|
| selected_route_id | יכול להיות ריק | מחרוזת | selected_route_id של המסלול |
| השם_המוצג | יכול להיות ריק | מחרוזת | השם המוצג של המסלול |
| סטטוס* | יכול להיות ריק | מחרוזת | סטטוס המסלול |
| validation_error | יכול להיות ריק | מחרוזת | שגיאת אימות של המסלול |
| low_road_usage_start_time | יכול להיות ריק | חותמת זמן | השעה שבה נצפה לראשונה שימוש נמוך בכביש במהלך אימות מחדש. היא משויכת ל-VALIDATION_ERROR_LOW_ROAD_USAGE. |
| route_attributes | יכול להיות ריק | מחרוזת | מאפיינים מותאמים אישית של המסלול שנבחר |
*סטטוס המסלול בטבלה הזו מתחיל ב-STATUS_ במקום ב-STATE_. אחרת, הוא עקבי עם Roads Selection API.
התנהגויות ועובדות שקשורות לטבלאות
- בטבלה הזו נכללים רק מסלולים בסטטוס STATUS_RUNNING או STATUS_INVALID.
- המטא-נתונים והסטטוס של המסלולים מתעדכנים כל שעה, ללא הפסקה.
- אחרי שיוצרים נתיב חדש ב-Roads Selection API, צריך לחכות עד שעה עד שהנתיב יהיה זמין בטבלה הזו.
- אחרי שמסלול נמחק מ-Roads Selection API, צריך להמתין עד שעה אחת עד שהמסלול שנבחר יוסר מהטבלה הזו.