Google Meet Media API מאפשר לכם לגשת למדיה בזמן אמת משיחות ועידה ב-Google Meet. האפשרות הזו מאפשרת מגוון תרחישי שימוש, כמו אפליקציות שמתעדות משימות, מספקות תובנות בזמן אמת לגבי הפגישה הנוכחית או מעבירות אודיו ווידאו בסטרימינג לממשק חדש.
תרחישים לדוגמה
אפליקציות שרשומות ב-Google Cloud Console יכולות להשתמש ב-Meet Media API כדי להתחבר לוועידות ב-Meet, וכך:
- צפייה בשידורי וידאו. לדוגמה:
- הזנת סטרימינג של סרטונים שנוצרו בשיחות ועידה ב-Meet למודלים של AI משלכם.
- סינון של הזרמות להקלטות בהתאמה אישית.
- צפייה בשידורי אודיו. לדוגמה:
- אפשר להזין אודיו ישירות ל-Gemini וליצור צ'אטבוט מבוסס-AI לפגישות.
- הזנת שידורי אודיו משיחות ועידה ב-Meet לשירות תמלול משלכם
- ליצור כתוביות בשפות שונות.
- ליצור פידים של שפת סימנים שנוצרו על ידי מודל מהאודיו שתועד.
- ליצור מודלים משלכם לסינון רעשים כדי להסיר רעשי רקע וארטיפקטים רועשים מהשיחה.
- צריכת מטא-נתונים של משתתפים. לדוגמה:
- לזהות אילו משתתפים נמצאים בוועידה, כדי לשפר את הניתוח והתובנות.
מחזור החיים של Meet Media API
בתמונות הבאות מוצג מחזור החיים של Meet Media API:
-
איור 1. הבוט של Meet Media API מנסה להצטרף לאתר של צד שלישי. החיבור נדחה אם יש חשבונות של משתמשים מתחת לגיל 18. -
איור 2. אפשר לסמן פגישות כמוצפנות ולהוסיף להן סימן מים. אי אפשר להתחבר ל-Meet Media API אם הפגישה מוצפנת או שיש בה סימן מים. -
איור 3. מוודאים שההגדרה של האדמין נכונה. -
איור 4. מגדירים את הפגישה ביומן. המארח צריך לתת הרשאה לאפליקציית הצד השלישי בהגדרות היומן, אחרת החיבור יידחה. -
איור 5. שינוי בהגדרה במהלך השיחה. אם המארח מחליט להשבית את ההגדרה Meet Media API במהלך שיחה, החיבור נפסק. -
איור 6. אם הבעלים של הפגישה משתמש בחשבון פרטי (חשבון שמסתיים ב- @gmail.com), היוזם חייב להיות נוכח בפגישה כדי לתת הסכמה, אחרת החיבור יידחה. -
איור 7. אחרי שהחיבור נוצר, המארח, המארחים הנוספים או כל המשתתפים באותו הארגון של המארח רואים את תיבת הדו-שיח של ההתחלה. -
איור 8. כל המשתתפים בשיחה יכולים להפסיק את השימוש ב-Meet Media API במהלך השיחה.
הדרישות לקבלת הסכמה
אפליקציות של Meet Media API יכולות להצטרף לפגישה רק אם יש בה משתתף שיש לו הרשאה לתת הסכמה בשם הפגישה.
לפגישות ב-Google Workspace
כדי לתת הסכמה בפגישות ב-Google Workspace, אתם צריכים להיות חלק מהארגון שהוא הבעלים של הפגישה. ברוב המקרים, הבעלים של הפגישה הוא אותו אדם שמארגן אותה. אם המארח או מי שהתחיל את הפגישה נמצאים בפגישה וגם שייכים לארגון שהוא הבעלים של הפגישה, תיבת הדו-שיח להפעלת השידור תוצג להם באופן מועדף.
לפגישות לצרכנים
בפגישות שאורגנו באמצעות חשבונות Gmail, היוזם צריך להיות בפגישה כדי לתת הסכמה.
מונחים נפוצים
- מספר הפרויקט ב-Cloud
- מזהה קבוע שנוצר
int64לפרויקט ב-Google Cloud. הערכים האלה נוצרים על ידי Google Cloud Console לכל אפליקציה רשומה. - ועידה
- מופע שנוצר בשרת של שיחה במרחב לפגישות. בדרך כלל המשתמשים רואים בתרחיש הזה פגישה אחת.
- ערוץ נתונים של משאבים לשיחות ועידה
במקום לבקש משאבים באמצעות HTTP, כמו ב-Google Meet REST API, לקוחות של Meet Media API מבקשים משאבים מהשרת באמצעות ערוצי נתונים.
יכול להיות שייפתח ערוץ נתונים ייעודי לכל סוג משאב. אחרי הפתיחה, הלקוח יכול לשלוח בקשות בערוץ. עדכוני משאבים יועברו באותו ערוץ.
- מקור תורם (CSRC)
בזרמי מדיה וירטואליים, אי אפשר להניח שזרם מדיה תמיד מצביע על אותו משתתף. ערך ה-CSRC בכותרת של כל חבילת RTP מזהה את המקור האמיתי של החבילה.
כשמשתתפים מצטרפים לפגישה ב-Meet, המערכת מקצה לכל אחד מהם ערך CSRC ייחודי. הערך הזה נשאר קבוע עד שהם עוזבים.
- ערוצי נתונים
ערוצי נתונים של WebRTC מאפשרים להחליף נתונים שרירותיים (טקסט, קבצים וכו') בנפרד מזרמי אודיו ווידאו. ערוצי נתונים משתמשים באותו חיבור כמו זרמי מדיה, ומספקים דרך יעילה להוסיף חילופי נתונים לאפליקציות WebRTC.
- Interactive Connectivity Establishment (ICE)
פרוטוקול ליצירת קישוריות, למציאת כל המסלולים האפשריים לשני מחשבים כדי לתקשר זה עם זה באמצעות רשתות עמית לעמית (P2P), ואז לוודא שהחיבור נשמר.
- סטרימינג של מדיה
מקור מדיה של WebRTC מייצג זרם של נתוני מדיה, בדרך כלל אודיו או וידאו, שצולמו ממכשיר כמו מצלמה או מיקרופון. הוא מורכב מטראקים של שידורי מדיה אחד או יותר, שכל אחד מהם מייצג מקור מדיה יחיד, כמו טראק וידאו או טראק אודיו).
- Media stream track
מורכב מזרם חד-כיווני יחיד של מנות RTP. רכיב MediaStream יכול להיות אודיו או וידאו, אבל לא שניהם. חיבור דו-כיווני של פרוטוקול להעברה בטוחה בזמן אמת (SRTP) מורכב בדרך כלל משני רכיבי מדיה: יציאה מנקודת קצה מקומית לנקודת קצה מרוחקת וכניסה מנקודת קצה מרוחקת לנקודת קצה מקומית.
- מקום הפגישה
מקום וירטואלי או אובייקט קבוע (כמו חדר ישיבות) שבו מתקיימת ועידה. בכל מרחב אפשר לקיים רק שיחת ועידה פעילה אחת בכל זמן נתון. בנוסף, מרחב לפגישות מאפשר למשתמשים להיפגש ולמצוא משאבים משותפים.
- משתתף
אדם שהצטרף לשיחה או שמשתמש במצב Companion, צופה בה, או מכשיר בחדר שמחובר לשיחה. כשמשתתף מצטרף לוועידה, מוקצה לו מזהה ייחודי.
- שידורים רלוונטיים
יש הגבלה על מספר הזרמות האודיו הווירטואליות והזרמות הווידאו הווירטואליות שלקוח יכול לפתוח.
יכול להיות שמספר המשתתפים בשיחת ועידה יהיה גדול יותר. במקרים כאלה, שרתי Meet מעבירים את זרמי האודיו והווידאו של המשתתפים שנחשבים ל "הכי רלוונטיים". רמת הרלוונטיות נקבעת על סמך מאפיינים שונים, כמו שיתוף מסך והזמן שעבר מאז שהמשתתף דיבר.
- יחידת העברה סלקטיבית (SFU)
יחידת העברה סלקטיבית (SFU) היא רכיב בצד השרת בשיחות ועידה ב-WebRTC שמנהל את ההפצה של זרם המדיה. המשתתפים מתחברים רק ל-SFU, שמעביר באופן סלקטיבי סטרימינג רלוונטי למשתתפים אחרים. כך מצטמצם העיבוד בצד הלקוח ורוחב הפס הדרוש, ומתאפשרות ועידות שניתנות להרחבה.
- Session Description Protocol (SDP)
מנגנון האיתות שבו משתמש WebRTC כדי לנהל משא ומתן על חיבור P2P. החשבון
RFC 8866הוא החשבון הראשי.- תשובת SDP
התשובה להצעת SDP. התשובה דוחה או מאשרת כל זרם שהתקבל מהעמית המרוחק. הוא גם מנהל משא ומתן לגבי הזרמים שהוא מתכנן לשדר בחזרה למשתתף שהציע את ההצעה. חשוב לציין שלא ניתן להוסיף לתשובת ה-SDP זרמים עם אותות מההצעה הראשונית. לדוגמה, אם עמית שמציע שידור מציין שהוא מקבל עד שלושה שידורי אודיו מהעמית המרוחק שלו, העמית המרוחק לא יכול לציין ארבעה שידורי אודיו להעברה.
- SDP offer
ה-SDP הראשוני בתהליך האימות של עמית לעמית (P2P) של ההצעה והתשובה. המבצע נוצר על ידי העמית היוזם ומכתיב את התנאים של סשן העמית לעמית. המבצע תמיד נוצר על ידי לקוח Meet Media API ונשלח לשרתי Meet.
לדוגמה, בהצעה יכול להיות מצוין מספר זרמי האודיו או הווידאו שהצד המציע שולח (או יכול לקבל), והאם צריך לפתוח ערוצי נתונים.
- מקור סנכרון (SSRC)
מזהה SSRC הוא מזהה בן 32 ביט שמזהה באופן ייחודי מקור יחיד של זרם מדיה בתוך סשן RTP (פרוטוקול להעברה בזמן אמת). ב-WebRTC, מספרי ה-SSRC משמשים להבחנה בין זרמי מדיה שונים שמגיעים ממשתתפים שונים או אפילו מטרקים שונים של אותו משתתף (למשל, מצלמות שונות).
- RtpTransceiver
כפי שמפורט במאמר
RFC 8829, משדר-מקלט הוא הפשטה של סטרימינג ב-RTP בסשן של תקשורת ישירה.משדר/מקלט יחיד ממופה לתיאור מדיה יחיד ב-SDP ומתואר על ידו. משדר-מקלט מורכב מ
RtpSenderומRtpReceiver.מכיוון ש-RTP הוא דו-כיווני, לכל עמית יש מופע משלו של משדר/מקלט לאותו חיבור RTP.
RtpSenderשל משדר-מקלט נתון עבור העמית המקומי ממופה ל-RtpReceiverשל משדר-מקלט ספציפי בעמית המרוחק. וגם ההפך. RtpSenderשל אותו משדר/מקלט של העמית המרוחק ממופה ל-RtpReceiverשל העמית המקומי.לכל תיאור מדיה יש משדר/מקלט ייעודי משלו. לכן, בסשן עמית לעמית עם כמה שידורי RTP יש כמה משדרי רדיו עם כמה
RtpSendersו-RtpReceiverלכל עמית.- Virtual Media Streams
זרמי מדיה וירטואליים הם זרמי מדיה מצטברים שנוצרים על ידי יחידת העברה סלקטיבית (SFU) בוועידות WebRTC. במקום שכל משתתף ישלח לכל אחד אחר סטרימים נפרדים, שרת ה-SFU מבצע מולטיפלקס של סטרימים נבחרים של משתתפים לסטרימים וירטואליים יוצאים במספר קטן יותר. כך אפשר לפשט את טופולוגיית החיבור ולהפחית את העומס על המשתתפים, וגם לאפשר ועידות שניתנות להרחבה. כל זרם וירטואלי יכול להכיל מדיה מכמה משתתפים, שמנוהלת באופן דינמי על ידי SFU.
נושאים קשורים
כדי ללמוד איך להתחיל לפתח לקוח של Meet Media API, פועלים לפי השלבים במאמר תחילת העבודה.
במאמר הפעלה מהירה של לקוח הפניה ל-Meet Media API ב-C++ מוסבר איך להגדיר ולהריץ לקוח לדוגמה של Meet Media API.
סקירה כללית של המושגים מופיעה במאמר מושגים ב-Meet Media API.
מידע נוסף על WebRTC זמין במאמר WebRTC For The Curious.
מידע על פיתוח באמצעות ממשקי API של Google Workspace, כולל טיפול באימות ובמתן הרשאה, זמין במאמר פיתוח ב-Google Workspace.