8

海外new things | 新加坡技术初创「Betterdata」种子轮融资155万美元,用合成数据来确...

 1 year ago
source link: https://www.36kr.com/p/2226526854697601
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

海外new things | 新加坡技术初创「Betterdata」种子轮融资155万美元,用合成数据来确保真实数据的安全

宋小予·2023-04-26 07:03
协助开发者保护敏感数据,遵守GDPR和HIPAA等数据保护法规。

据外媒TechCrunch报道,新加坡技术初创「Betterdata」近期宣布完成155万美元的种子轮融资,由Investible领投,Franklin Templeton、Xcel Next、新加坡科技设计大学、Bon Auxilium、Tenity、Plug and Play和Entrepreneur First跟投。

「Betterdata」由首席执行官Uzair Javaid博士和首席技术专家Kevin Yee两人于2021年联合创办,致力于用可编程的合成数据来确保真实数据的安全。

quality,q_90

图片截自企业官网

该公司目前正在与新加坡和美国的两所大学进行研发合作,但创始人拒绝透露具体的学校名称。该公司的客户之一是我国的浦发银行。

随着世界各地数据保护法规越来越严格,数据共享正变得更快、更安全。与传统的数据共享方法不同,「Betterdata」并不通过数据匿名化,而是利用生成性人工智能和隐私工程来代替原数据。

Yee在采访中解释说,「Betterdata」的程序化数据合成使用生成模型,包括用于深度伪造的生成对抗模型、用于ChatGPT的转化器、用于稳定扩散的扩散模型等深度学习模型,来创建并加强新的数据集。这些合成数据集具有与真实世界数据相似的特征和结构,但不会泄露个人隐私或敏感信息。

“我们的想法是创建一个真实数据集的虚构版本,用于保护机密数据、减少偏见、改进机器学习模型等。”Yee补充说。

程序化合成数据能协助开发者保护敏感数据,遵守GDPR和HIPAA等数据保护法规,在不同团队之间增强数据的泛用性,甚至创建更多的数据来训练、测试和验证机器学习模型,为代表性不足的群体或类别创建新数据,进而解决数据不平衡的问题。

「Betterdata」计划利用新资金进行产品发布,并加强其可编程合成数据技术栈,支持单表、多表和时间序列数据集。Yee表示,这些表格数据集的主要区别在于其结构和所要解决的问题。例如,单表数据集专注于多个彼此相互独立的数据表,而多表数据集则需考虑多个表的数据之间的关系,而时间序列数据集则需要随着时间的推移收集、处理数据。

此外,该公司还计划雇佣更多销售和营销人员,在未来一到两年内将业务扩展到新加坡以外的更多亚太地区。

本文来自翻译, 如若转载请注明出处。

本文图片来自:企业授权、Pexels


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK