在人工智能(AI)与大数据蓬勃发展的时代,数据科学已成为推动科技进步的核心力量。面对每日涌现的海量资料,如何有效储存、分析和处理这些信息,成为了别具挑战性的研究命题,亟待探索。香港浸会大学(浸大)理学院院长兼罗嘉穗博士数据科学教授吴国宝教授指出:「数据科学在我们的日常生活中无处不在,从手机应用程序到科学与工程领域,皆扮演着关键角色。」在今期专访,吴教授将带我们走进数据科学的世界,讲解这门学科在生物医学、脑科学、环境监测乃至日常生活之中的价值及应用。
推动生物与医学研究 分析脑部疾病
数据科学是一门跨学科学问,融合应用数学、统计学、机器学习及计算器科学等领域,其应用层面广阔而深远,涵盖图像处理、生物信息、医疗、遥距感应(遥感)、电子商务、金融等诸多范畴。数据分析和AI在浸大《策略发展计划2018-2028》中被列为重点研究领域,吴教授及其团队近年积极探索相关技术,推动其发展与实际应用。
其中一项主要研究是运用图像处理技术剖析细胞影像。吴教授解释:「收集所得的数据往往品质欠佳,充斥杂讯与残缺不全。数据科学的任务之一,就是透过建立模型来去除影像中的杂讯,并根据生物机制补足缺失的信息。经过处理的高品质影像,让生物学家能够更细致地观察细胞内部的结构组成,并掌握不同细胞组件的运输过程,从而找出细胞功能异常及疾病的成因。」
这项技术亦适用于提升脑部数据分析的成效。透过处理磁力共振影像,团队能合成高质素的影像,更准确地判断大脑中的异常区域,特别是与阿兹海默症相关的病变。这不但有助于早期诊断,还能深入了解疾病对大脑功能的影响,为神经科学与疾病防治提供强而有力的依据。
解码复杂数据 发掘潜在信息
以上应用的原理,根植于数据科学的核心技术──数据建模。其作用是把原始数据转化为有意义的结构,为后续分析、预测与决策提供基础。吴教授指出,无论是脑部或生物化学数据,往往都具有高维度甚至多维度的结构特征,传统的矩阵计算方法已不敷应付。
「为了分析这些复杂数据,我们采用多维度建模方法,并运用高阶奇异值分解(High-order singular value decomposition, HOSVD)来发掘影像中的隐藏模式与结构。」透过这些方法,研究人员能够从影像中辨识潜在信息,进一步推动疾病分析、分子机制研究的进展,为生物医学领域带来创新性的突破。
结合遥感技术 协助环境研究
数据科学不仅改变医学,在地球科学与环境研究中亦大放异彩。科学家常利用人造卫星或飞机作遥感探测,收集地球表面、大气层、海洋环境及人类活动等数据。同样地,传感器在收集数据时可能产生杂讯,导致影像失真,此时便需借助数据科学的力量。吴教授指出:「数据科学能提升卫星影像的数据品质,使地面细节与天气变化更清晰地呈现,帮助研究气候模式与环境变化。」
可见,这些技术不仅有助于基础科学研究,也能广泛应用于灾害预测、环境监测及城市规划,充分展现数据科学的跨领域价值与多元效益。
数据科学融入生活 提升日常体验
数据科学看似遥不可及,其实早已悄然融入我们的日常生活。例如,我们每天使用的搜索引擎,正是仰赖大数据分析以及算法,洞察用户的行为与需求,进而提供个人化的搜寻结果与推荐内容,当中涉及不少数学理论。
吴教授近年亦带领团队以图论法分析数据,开发应用于数字平台的推荐系统。该系统能够精准捕捉用户的行为模式与偏好,并据此推送切合其需求的产品建议,提升用户体验的同时,也增强平台的效能与商业价值。
探索储存技术 应对数据洪流
在信息爆炸的时代,数据量不断激增,如何在有限储存空间内保存、管理与维护数据,成为数据科学与产业界共同面对的挑战。目前,编码技术在这方面扮演着至关重要的角色。透过适当的编码,数据可转换为特定格式,压缩冗余数据以节省储存空间之余,更具备错误修正和加密效能,确保数据在储存与传输过程中的完整性、安全性和可读性。
吴教授表示:「数据无时无刻、无处不在地产生,要有效储存如此庞大的数据量,发展创新且高效的储存技术实乃当务之急。」这显示出储存技术的创新变革,是未来数据科学研究的重要方向。
数理为基 走出应用数学大道
吴教授在1990年代取得数学博士学位后,远赴澳洲国立大学担任计算器科学实验室研究员,从此开启其应用导向的学术生涯。凭借扎实的数学根基,他把理论灵活应用于计算数学、AI、机器学习、数据科学及科学计算等领域的研究,累积深厚的跨学科学术造诣。他说道:「我致力将数学带进生活,解决现实问题,因此特别关注具有巨大应用潜力的课题。随着数据在各行各业越来越常见,它亦成为我学术研究的核心。」
2005年,吴教授加入浸大数学系,历任数学系系主任、数学系与计算器科学系讲座教授,期间曾短暂离开浸大,至2023年重新回归并出任理学院院长。其学术成就及贡献屡获肯定,包括在2017年摘下第12届中国科学院「冯康科学计算奖」并当选美国工业与应用数学学会(SIAM)会士;以及于2017年至2025年度连续获史丹福大学评为全球首2%頂尖科学家。
2025年,吴教授荣膺美国数学学会院士;跻身国际学术研究平台Research.com「全球顶尖科学家榜」百大数学家之列,并获该平台颁发「年度中国计算器科学与数学领袖奖」;同时获科睿唯安(Clarivate)评选为「年度最广获征引研究人员」(数学范畴)。此外,他又凭研究项目「高维数据概念表示与解释的理论方法」(Theoretical Methods for Conceptual Representation and Interpretation of High-Dimensional Data)荣获北京市科学技术奖自然科学奖二等奖。这些殊荣充分展现他在数学与计算器科学领域的影响力。
AI时代的跨学科教研新格局
吴教授素来注重科研的实务应用和跨学科发展。早在十多年前,他已在浸大数学系推动生物信息学,带领研究团队聚焦生物统计学的理论建构与实务应用,为跨学科研究奠定坚实的基础。接掌理学院院长后,他持续善用自身的跨学科优势,为学生与研究人员开拓更广阔的学术视野与实践空间。
投身科研和教学30载,吴教授见证了AI、数学、数据科学及科学计算等领域在浸大乃至整个学术界的迅速发展,以及其对世界的深远影响。面对AI崛起带来的冲击与机遇,他认为AI是打破学科壁垒、推动知识交叉流动的催化剂。「我们正在探索如何运用AI协助人才从一个领域跨足到另一个领域。这是跨学科教育的重要一环,在这个过程中,AI不仅是一项工具,更是引导人们转移技能与掌握新知的桥梁。」
以数据科学造福社会
在科技日新月异、信息瞬息万变的世代,社会发展已离不开科学与科技的推动,真正的创新,源于不同学科之间的协作。吴教授特别感谢罗嘉穗博士捐资成立「数据科学教授席」,为浸大的数据科学研究提供了宝贵支持。未来,他将善用研究资金,邀请世界各地的学者前来浸大,围绕数据科学的多元课题展开深度交流与合作,激发创新思维,促成更多突破性的研究成果。
数据不再只是冷冰冰的数字,而是消除产业痛点、创造价值的密钥。吴教授总结道:「我们希望透过与其他领域的合作,让数据科学研究能够应对当今社会的复杂挑战。」
*此访问稿于2026年3月刊登。
浸大计算器科学系与辉达公司(NVIDIA)于2025年联合举办研讨会,探讨艺术科技及医疗保健领域的技术发展,并邀得NVIDIA人工智能技术中心首席解决方案架构师及环球主管施忠伟教授(左二)担任主讲嘉宾
吴教授自2024年起出任罗嘉穗博士数据科学教授