武漢肺炎(COVID-19)疫情不斷升溫,且在全球持續蔓延,為對抗疫情,臺灣於2月初時,全面延後了各級學校的開學時間。疫情期間,線上教學的需求頓時大幅成長,TutorABC營運長暨數據長沈沛鴻回憶:「2月初時,平臺的流量翻倍成長。」因應疫情,TutorABC更在大年初二決定,將原本計畫明年才對外開放的線上教學平臺,提早免費提供外部教學機構試用開課。
這不是TutorABC第一次遇到大規模的傳染病疫情,TutorABC於1998年成立時,以實體小班教學起家,2003年SARS肆虐臺灣,嚴重影響了實體教學機構,許多機構被迫停課,然而,TutorABC因已開始發展線上教學,讓他們能快速應變,不需停課,當年這場流行疫情更促使TutorABC在2004年,踏入了線上真人教學平臺的市場。
直到現在,TutorABC每年開設超過3千萬堂的課程,全球老師達3萬名,累計5千萬學生人次,還有2萬份教材,如何依據每位學生的特性和需求,提供專屬的學習內容,老師、學生和教材三者的媒合是客製化的關鍵,背後則需靠大量的資料分析和AI應用。
推動TutorABC走向大數據分析的關鍵人物正是沈沛鴻,他在2008年加入時,擔任技術長一職,一手負責規畫IT雲端基礎架構,來因應老師與學生分散於全球逾135國的挑戰。沈沛鴻表示,線上交易處理(OLTP)的部分採分散式,於各銷售點處理交易資料,而線上分析處理(OLAP)則採集中式處理。
他進一步解釋OLAP,因老師身處全球各地且學生也在各處,所以從公司整體營運角度來考量,他們的行為資料採集中的方式來處理及分析。這一個雲端基礎架構更是TutorABC發展大數據和AI應用的利基點。
TutorABC於2015年時,更成立專責單位商業智慧(BI)部門,就是如今資料科學中心的前身,而沈沛鴻從2018年開始身兼數據長,率領資料科學團隊,要藉數據分析找到公司最佳的營運方式。
沈沛鴻指出,資料處理的流程中,資料蒐集是一大課題。大多數的網路公司可蒐集用戶於網頁或應用App留下的行為資料,像是點擊、瀏覽等紀錄,作為分析的依據,然而,TutorABC的服務以視訊為核心,網頁紀錄不足,這成為資料分析團隊得先解決的問題。
打造2種資料蒐集工具,以收集用戶課堂上的行為資料
沈沛鴻推出了兩個資料蒐集的工具,運用在虛擬教室中,來掌握用戶的課堂行為,作為後續調整課程的分析資料來源。第一個是標註工具,這是TutorABC提供老師和學生於課堂中評價感受的工具,老師可視學生的學習反應,給予大拇指、星星等符號,而學生不只可以評價老師的教學表現,也可用符號來描述自己的學習表現或狀態。該工具就像是平時臉書用戶觀看直播時,可依當下的感受點選表情符號,提供直播者反饋的設計。
老師和學生於教學情境裡留下的這些互動標註,成為了TutorABC蒐集師生行為資料的一大來源。這些標註資料具兩大特點,沈沛鴻解釋,第一,反映用戶當下的感受,其次,標註的時間點分散於整個學習過程。他提到,不同以往透過課後評鑑問卷,包含詢問老師、教材、系統通訊品質等項目,來了解學生的學習狀況,他認為,問卷只憑雙方記憶來評鑑,「然而,用戶每一分鐘的感受都不相同,評鑑無法真實反映整堂課的評價。」
其次是數據探針機制,TutorABC的資料分析團隊從2018年下半年開始,藉由視訊畫面蒐集老師的教學表現,包含動作、臉部表情、聲音語調等,再導入第三方的AI模組,利用深度學習技術分析行為,了解老師的專注度等。之後,團隊也採同樣的作法來分析學生的學習表現,掌握他們的參與度、開口的時間長短等,來進一步闡釋該堂課的教學品質。不過,沈沛鴻強調,因視訊畫面涉及隱私,學生方面聚焦蒐集聲音語調的資料。
除了上述動態蒐集的資料,TutorABC也自行開發了一套動態課程生成系統(Dynamic Course Generation System,DCGS),來收集上萬名老師、全球各地學生和上萬教材的所有關聯屬性,進行師生的配對,還有排定課堂的內容和課堂的先後順序,甚至,還能根據學生前一堂課的表現,動態調整下一堂課的內容。
系統分析用戶的軟硬屬性,以配對師生和生成客製化的學程
數據是研發成果的檢核指標,也是驅動下一波研發的動力來源。 ─── TutorABC營運長暨數據長 沈沛鴻。 (攝影/洪政偉) |
蒐集完資料後,TutorABC依資料屬性分為兩大類,一類是硬屬性資料,學生方面包含了年齡、行業類別、學習動機、興趣、學習程度等,DCGS系統透過串接學習管理系統(LMS),來獲得學生報名時填寫的硬屬性資料。老師的硬屬性則包含性格、熟悉領域、文化背景、教學資歷等,由該系統與教學管理系統(TMS)串接,來取得老師申請職務時填寫的硬屬性資料。教材方面的硬屬性有等級、主題、加強的知識類型、時長等。沈沛鴻表示,起初採用人工的方式標示教材的硬屬性,現已開始利用AI來辨識教材的語意,進而標示屬性。
另一類是軟屬性資料,為學生學習和老師教學的行為屬性,也就是兩方的課堂表現。這些資料可從課堂標註和數據探針兩個資料蒐集工具,來獲得他們課堂上的行為資料,再放入DCGS系統進一步分析、歸納。學生的軟屬性包含偏好發問、喜歡舉例、容易與同學互動等,老師的軟屬性則有教學風格、擅長類型、互動方式等。
在取得這些屬性的資料後,分析人員便會透過DCGS分析師生、教材的軟硬屬性資料,再將資料輸入演算法來媒合師生,還有調整課程的內容。沈沛鴻表示,透過分析這兩種資料的類型,系統可就學生需加強的部分,打造適合他的學習歷程。
其實,TutorABC從線下教學時期就開始提供個人化課程,為每個等級設計上千份,涵蓋不同領域內容的教材,像是體育、藝術、生物等,再依學生的興趣提供相符的教材。轉為線上教學後,TutorABC延續該模式,於2006年就推出了第一代的DCGS,不過這代系統僅著重分析硬屬性資料,直到第二代才納入老師與學生的軟屬性資料,進一步分析他們的課堂表現,提高師生媒合的匹配度,還有提升動態調整學程的品質。
該系統歷經多次改版,沈沛鴻表示,團隊每2至3天就會討論一次演算法,比如當系統可蒐集更為精細的資料時,團隊會調整演算法來處理更多的參數,以更精確地解釋屬性。他表示,調整系統為一個細化過程,需設定每一次的目標,也就是學生學習效果的變化。由於,短時間內衡量學習效果不易,因此,該團隊將演算法的輸出值Y細分為多個y項目,包含了字彙量、句型量等,來從不同的面向衡量學習的成果,並搭配課後測驗來量化各項目的表現,掌握各項目提升的幅度。
此外,TutorABC發展線上教學逾15年,累計的可觀資料量也成為資料團隊的分析利器。沈沛鴻表示,每當新的AI技術出現,資料科學團隊會將累積的1.8億份課堂側錄影片,餵入演算法,來獲得新的分析結果。
團隊依產品線分工以機動支援需求,同時設中央軍避免重工
TutorABC資料科學團隊的分工方式隱藏了沈沛鴻的兩個領導秘訣,首先,團隊部分人員依產品線分工,讓資料人員可快速滿足產品的分析需求。TutorABC視公司每個營運環節,從行銷、銷售、教學到周邊客服,各為一個產品線,沈沛鴻藉此定義來劃分資料團隊,讓每個產品線都具有自身的資料人員。他稱這些進駐產品線的資料人員為地方軍,他們與產品經理、業務維運團隊緊密互動,因為,只有身處第一線才能了解產品線的Know-How。
再者,這些資料人員不需等待團隊提出規格需求單後,再分析資料,而是直接從參與產品線的討論中,自行發現分析需求,進而著手規畫或優化演算法。沈沛鴻認為,因應快速迭代的環境,以及不斷變化的市場和客戶需求,各產品線都需具備靈活性,且可快速與使用者接軌的能力。有鑑於此,他不採取長時間規畫單一系統的策略,而是保留系統架構的彈性,讓資料人員視需求,邊開發邊調整演算法,避免全面重新開發的狀況發生。
沈沛鴻提到的第二個秘訣是避免重工。他認為,多個產品團隊都有用的相同技術應轉換為可共用的技術模組,才能避免資源浪費。所以他保留部分人員來處理全公司性的資料業務,並稱他們為中央軍,負責將這些共有技術經中性化處理,抽離與單一產品特性相關的參數,包裝成可快速使用的功能模組,來提供各產品團隊使用。
沈沛鴻以語音辨識功能為例,銷售團隊需分析銷售人員的電話內容,教學端需分析師生的課堂對話,客服端則需分析客服的電話內容,他指出,透過中央軍提供的語音辨識功能模組,各產品團隊可節省自行研究和開發的時間。
身為營運長的沈沛鴻也依產品線劃分研發團隊,讓各產品團隊有自身的研發資源。他更指出,數據和研發密不可分,因為不管是內部系統,還是對外的服務和功能,都需不斷透過數據追蹤,來修正,「數據是研發成果的檢核指標,也是驅動下一波研發的動力來源。」他進一步強調,每一個環節都需要找出最佳的祕方來提升表現,以改變公司的整體營運。
因各產品線都有資料使用的需求,且資料的使用者分散各地,TutorABC格外重視資料的安全性。像是該資料分析團隊也採用「僅知原則」(Need to Know Basis)來準確切割人員的資料能見度,依據各人員的職權和職務內容,了解他們所需使用的資料,從而規畫資料的存取權限,以確保營運安全,以及符合隱私政策。
沈沛鴻表示,人員獲得的資料應是必須知道的,而非不相關、不需要、不應該知道的,他強調,「讓善良的使用者不需承擔保密的責任,同時,不讓惡意的使用者獲得不應知道的資料。」
他的下一階段計畫將朝平臺化發展,以加入更多外部的學習課程。例如,未來TutorABC將打造一個平臺,提供自家服務和系統給外部的教學機構使用,而提前開放的線上教學視訊平臺僅是該戰略的一環。進一步更要把DCGS、LMS等系統轉變為各科目可通用的模組,再與視訊平臺結合,來提供排課、追蹤管理等功能。沈沛鴻表示,這些系統原針對英文課程設計,團隊將抽離系統內與英文相關的屬性,讓第三方使用。因疫情的催化,他說,將加速調整系統的腳步,計畫在下半年提供。
CDO小檔案
沈沛鴻
TutorABC營運長暨數據長
學歷:臺大EMBA資訊管理組
經歷:於2008年加入TutorABC,初期擔任技術長,負責規畫雲端基礎架構,以及開發系統,包含客戶學習與關懷追蹤系統、業務銷售系統、數據系統等,3年後,接任營運長,從2018年開始兼任數據長,來帶領資料科學團隊推動數據分析的工作,找出公司最佳的營運方式。
公司檔案
TutorABC
● 地址:臺北市中正區羅斯福路二段100號20樓
● 網址:www.tutorabc.com
● 成立時間:1998年
● 主要業務:提供真人即時互動的客製化英語學習課程,另還有提供中文、數學和程式設計的線上真人教學課程
● 總部:臺北市
● 董事長:楊正大
● 總經理:黃嘉琦
● 用戶分布:全球逾135國
● 員工數:逾5,000人
● 數位部門名稱:資料科學中心
● 數位部門主管:沈沛鴻
公司大事紀
● 2004年:成立真人線上學習平臺TutorABC,從線下實體教學機構正式走向線上教學平臺,展開第一代DCGS系統的開發工程
● 2005年:全球營運暨教學中心成立,完成教學資源規模化
● 2006年:第一代DCGS動態課程生成系統上線
● 2008年:成立中文學習平臺TutorMing
● 2010年:第二代DCGS系統上線
● 2011年:發展行動學習,推出TutorMobile,啟用全球雲端運籌中心
● 2015年:成立商業智慧(BI)部門,現資料科學中心的前身
● 2018年:藉由數據探針機制,從視訊畫面中蒐集老師的行為資料
●2020年:開放線上教學平臺TutorMeet+給外部教學機構使用
熱門新聞
2024-12-24
2024-08-14
2024-12-22
2024-12-20
2024-12-23