
2023年1月12日 |
会议地点:理工配楼101会议室 |
全体同学 |
【内容】: (1)根据学习、科研内容进行本学期总结汇报; (2)结合学习、科研情况,构思、撰写每个人的WAMDM之数据一味,撰写完成的同学可于周四组会时将自己的"数据一味"融合到展示中。请参考先前已发布的"WAMDM之数据一味"的格式:篇幅不长、简单明了,突出一个关键词,结合两三张图片为宜,标题请注意总结为【一个关键词】(可结合本学期自己组会报告的PPT,从中截取数据一味插图,从报告的主要概念中拟定标题)。 |
会议地点:理工配楼101会议室 |
|
艾山 |
【题目】:Span-tagger:Nested and Fine-grained Named Entity Recognition 【摘要】:命名实体识别(NER)通常被认为是一个序列标签任务,其中Nested 嵌套实体识别和fine-grained细粒度的识别具有较大的挑战性。现有的方法虽然解决了部分挑战性,但仍存在未解决的问题。基于span的方法基本解决了嵌套识别问题,但目前的方法将span独立于context从而导致语义不完整。本文提出基于span的嵌套和细粒度的实体识别模型 span-tagger。该方法将字符级别的序列标注转换成span级别的序列标注,由于类别数量降低使得模型细粒度的识别更有保障。span-tagger 有效解决了嵌套识别和细粒度的实体识别问题,实验表明,span-tagger在四个数据集的效果优于现有的方法。 【知识概念】:Nested NER;Fine-grained NER 【参考文献】: [1] Luan Y, He L, Ostendorf M, et al. Multi-Task Identification of Entities, Relations, and Coreference for Scientific Knowledge Graph Construction[C]//Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing. 2018: 3219-3232. [2] Jeong Y, Kim E. SciDeBERTa: Learning DeBERTa for Science and Technology Documents and Fine-tuning Information Extraction Tasks[J]. IEEE Access, 2022. [3] Trivedi I, Majhi S. Span level model for the construction of scientific knowledge graph[C]//2020 5th International Conference on Computing, Communication and Security (ICCCS). IEEE, 2020: 1-6. |
刘俊旭 |
【题目】:Example-level Privacy Analysis in Federated Learning 【摘要】:联邦学习在医疗、金融等领域的广泛应用对数据隐私保护提出了更高的要求。实现样本级别的隐私保护意味着对参与联邦学习中的任意用户都能进行独立的隐私分析,实现不同程度的隐私保护;同时,为保证最终机器学习模型的可用性,我们应尽量避免非均匀的随机噪声对模型造成的偏差,从而实现算法隐私与可用性的权衡。为实现上述目标,我们提出基于非均匀数据采样策略的隐私保护联邦学习框架,在隐私放大理论的指导下实现个性化隐私保护。实现该框架的主要挑战之一是如何设定各样本的采样概率。为此,我们对采样概率与隐私代价的关系进行了研究,利用拟合方法构建了二者的数学模型。此方法不依赖于具体的联邦学习方法,可适用任何基于SGD的训练框架中。本次报告主要分享现阶段的研究进展。 【知识概念】:Personal Privacy;Uniform Privacy;individual RDP 【参考文献】: [1] Feldman V, Zrnic T. Individual privacy accounting via a renyi filter[J]. Advances in Neural Information Processing Systems, 2021, 34: 28080-28091. [2] Yu D, Kamath G, Kulkarni J, et al. Per-Instance Privacy Accounting for Differentially Private Stochastic Gradient Descent[J]. arXiv preprint arXiv:2206.02617, 2022. [3] Rogers R M, Roth A, Ullman J, et al. Privacy odometers and filters: Pay-as-you-go composition[J]. Advances in Neural Information Processing Systems, 2016, 29. [4] Zhu Y, Wang Y X. Poission subsampled rényi differential privacy[C]//International Conference on Machine Learning. PMLR, 2019: 7634-7642. [5] Girgis A, Data D, Diggavi S, et al. Shuffled model of differential privacy in federated learning[C]//International Conference on Artificial Intelligence and Statistics. PMLR, 2021: 2521-2529.
|
许婧楠 |
【题目】:A General Framework for Auditing Differentially Private Machine Learning 【摘要】:现有的隐私审计方法通常都是对DPSGD这一特定方法进行审计,具有很大的局限性。本次汇报将介绍nips2022中的一个方法,该方法提出了一种审计框架,可以审计多种机器学习中的差分隐私算法。同时也可以用于检测由于算法实施的错误而导致的隐私泄漏。 【知识概念】:logistic regression;Naive Bayes;Radom Forest 【参考文献】: [1] Lu F, Munoz J, Fuchs M, et al. A General Framework for Auditing Differentially Private Machine Learning[J]. arXiv preprint arXiv:2210.08643, 2022. |
2022年12月29日 |
会议地点:理工配楼101会议室 |
张旭康 |
【题目】:A Study of the Fundamental Performance Characteristics of GPUs and CPUs for Database Analytics 【摘要】:现在出现了很多GPU数据库,它们声称能比CPU数据库有几十倍甚至上百倍的性能增益。但是硬件专家会怀疑这样的事情,他们认为GPU性能增益应该最大为GPU和CPU内存带宽比。本次组会介绍一篇Sigmod2022年的论文,文章调查分析了当前已有GPU数据库加速的真实度,以及发现了其中GPU算子设计缺点,提出了基于Tile的GPU算子设计方法,让GPU算子加速增益尽可能接近内存带宽比。 【知识概念】:GPU DBMS;GPU-CPU heterogeneous analysis;High concurrency programming 【参考文献】: [1] Shanbhag A, Madden S, Yu X. A study of the fundamental performance characteristics of GPUs and CPUs for database analytics[C]//Proceedings of the 2020 ACM SIGMOD international conference on Management of data. 2020: 1617-1632. |
但唐朋 |
【题目】:查询负载感知下的最短路径查询 【摘要】:计算道路网络中的最短路径距离是一系列应用中的核心功能。为了实现这种距离查询的有效计算,现有算法经常应用2-hop标签,该标签为每个顶点构造标签,并通过仅执行标签的线性扫描来实现查询的计算。然而,很少有建议考虑到查询工作负载的时空特性。我们观察到,真实世界的工作负载表现出: 1) 空间偏斜,这意味着只有一小部分顶点被频繁查询;2) 时间局部性,这意味著相邻的时间间隔具有相似的查询分布。为了解决以上问题,本文提出了一个工作负载感知核心森林标签索引,以利用工作负载中的最短路径查询问题。 【知识概念】:2-hop;树分解 【参考文献】: [1] Zheng B, Wan J, Gao Y, et al. Workload-aware shortest path distance querying in road networks[C]//2022 IEEE 38th International Conference on Data Engineering (ICDE). IEEE, 2022: 2372-2384. |
2022年12月22日 |
会议地点:理工配楼101会议室 |
刘立新 |
【题目】:An Efficient Scheme for Traceability in Blockchain Systems 【摘要】:过度强调身份隐私保护使得区块链系统在实际应用中难以被监管,导致勒索软件、洗钱等恶意事件发生。如何在区块链系统中既能保护用户身份隐私又能追踪用户行为是值得研究的问题。现有方法大多数基于零知识证明实现,验证代价较大且不支持批量验证。本次汇报介绍一种高效的追踪方案,该方案具有高效和支持批量验证的特性。 【知识概念】:Identity Privacy;Identity-based Signature 【参考文献】: [1] Li Y, Yang G, Susilo W, et al. Traceable monero: Anonymous cryptocurrency with enhanced accountability[J]. IEEE Transactions on Dependable and Secure Computing, 2019, 18(2): 679-691. [2] Shao W, Jia C, Xu Y, et al. Attrichain: Decentralized traceable anonymous identities in privacy-preserving permissioned blockchain[J]. Computers & Security, 2020, 99: 102069. [3] Li P, Xu H, Ma T. An efficient identity tracing scheme for blockchain-based systems[J]. Information Sciences, 2021, 561: 130-140. |
李梓童 |
【题目】:DeltaGrad:一种加速模型重训练的方法 【知识概念】:general ML techniques;rapid retraining;exact unlearning 【参考文献】: [1] Wu Y, Dobriban E, Davidson S. Deltagrad: Rapid retraining of machine learning models[C]//International Conference on Machine Learning. PMLR, 2020: 10355-10366. |
2022年12月15日 |
会议地点:理工配楼101会议室 |
王雷霞 |
【题目】:差分隐私的范围查询研究 【摘要】:区间范围查询是地理位置搜索、商品搜索、以及数据库检索中的常见查询,因场景的不同,涉及一维(1-D)、二维(2-D)、至多维(M-D)的范围查询。在差分隐私中,研究者们通常基于层次树响应1-D范围查询,基于网格响应2-D范围查询,并将这两种方式结合响应M-D范围查询,并致力于调节ε的划分、层次树的扇出、网格划分粒度等参数,优化范围查询的结果。最新的,ICDE 2022中Wang Yufei使用Prefix-Sum Cube响应本地化差分隐私(LDP)场景下的多维查询;VLDB 2022中Sepanta Zeighami使用机器学习的方法学习中心化差分隐私(CDP)场景下的二维查询。本次报告将对当前的差分隐私场景下的范围查询进行介绍,并提出,当前的本地化差分隐私的范围查询方法均依赖于数据的均匀假设,从而导致可用性的损失。我们拟从数据的均匀假设出发,构建1-D层次树与2-D网格,从而提升LDP下范围查询的可用性。 【知识概念】:tree-based range query;grid-based range query;Prefix-Sum Cube;ML for range query 【参考文献】: [1] Wang Y, Cheng X. PRISM: Prefix-Sum based Range Queries Processing Method under Local Differential Privacy[C]//2022 IEEE 38th International Conference on Data Engineering (ICDE). IEEE, 2022: 433-445. [2] Zeighami S, Ahuja R, Ghinita G, et al. A neural database for differentially private spatial range queries[J]. Proceedings of the VLDB Endowment, 2022, 15(5): 1066-1078. |
彭迎涛 |
【题目】:推荐系统的黑盒攻击技术 【摘要】:深度神经网络的推荐系统容易受到对抗性攻击,攻击者可以将精心制作的虚假信息注入目标推荐系统来实现恶意目的(例如提升或降级目标项目)。由于目标系统的安全和隐私方面的考虑,在现实场景中,黑盒的对抗性攻击更为实用,因为攻击者无法轻易获取目标系统的结构、参数、训练数据等数据。因此,在推荐系统这类稀疏特征任务上的黑盒攻击更具有挑战性。本次汇报介绍一种知识图增强的黑盒攻击框架(KGAttack),通过深度强化学习技术学习攻击策略,提升攻击效果。 【知识概念】:黑盒攻击;强化学习;知识图谱 【参考文献】: [1] Chen J, Fan W, Zhu G, et al. Knowledge-enhanced Black-box Attacks for Recommendations[C]//Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining. 2022: 108-117. [2]Fan W, Derr T, Zhao X, et al. Attacking black-box recommendations via copying cross-domain user profiles[C]//2021 IEEE 37th International Conference on Data Engineering (ICDE). IEEE, 2021: 1583-1594. |
2022年12月8日 |
会议地点:理工配楼101会议室 |
王文礼 |
【题目】:大数据因果推断:方法与挑战 【摘要】:对因果的探索源于哲学,可追溯至亚里士多德时期;二十世纪九十年代,因果科学受到广泛关注,并在医疗、统计等领域中成功应用。近年来,随着机器学习发展遇到瓶颈,有学者开始反思以关联分析的局限性,围绕因果关系发现、因果推断等开展研究。大数据为因果推断提供了新的研究手段,也提出了新的挑战,本次组会从方法和挑战的角度报告大数据背景下的因果推断。 【知识概念】:潜在结果模型;因果结构模型;全空间网络;多点归因【参考文献】: [1] Yao D, Gong C, Zhang L, et al. CausalMTA: Eliminating the User Confounding Bias for Causal Multi-touch Attribution[J]. arXiv preprint arXiv:2201.00689, 2021. [2] Zhong K, Xiao F, Ren Y, et al. DESCN: Deep Entire Space Cross Networks for Individual Treatment Effect Estimation[C]//Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining. 2022: 4612-4620. [3] Shalit U, Johansson F D, Sontag D. Estimating individual treatment effect: generalization bounds and algorithms[C]//International Conference on Machine Learning. PMLR, 2017: 3076-3085. |
郝新丽 |
【题目】:GWAC光变曲线数据的异常检测研究 【摘要】:当前时间序列异常检测的相关研究可以分为单维和多维两大类,并且二者可以进行转化。但在天文科学发现的场景中,单维或多维的分析均不能满足要求:由于各天体的亮度是自主的,互相没有影响,但人工观测的过程中,产生了与时间和空间相关的噪声干扰,因此既不能当做单维时间序列单独分析每个天体,又不能简单拼接为多维时间序列。本次报告提出了一种新型的网络,用于解决天文科学发现场景下的时间序列异常检测问题。结合单维/多维的时间序列建模方式,结合时间/空间约束,并提出一种新型的异常得分计算方式,从而提高科学发现的准确性,降低误报率。 【知识概念】:谱域图卷积网络;Transformer;切比雪夫多项式 【参考文献】: [1]Tuli S, Casale G, Jennings N R. TranAD: Deep transformer networks for anomaly detection in multivariate time series data[J].VLDB,2022. [2]Yu H, Li T, Yu W, et al. Regularized Graph Structure Learning with Semantic Knowledge for Multi-variates Time-Series Forecasting[J]. IJCAI,2022 [3]Cao D, Wang Y, Duan J, et al. Spectral temporal graph neural network for multivariate time-series forecasting[J]. NeruIPS,2020, 33: 17766-17778. |
2022年12月1日 |
会议地点:理工配楼101会议室 |
马超红 |
【题目】:DataPrism: Exposing Disconnect between Data and Systems 【摘要】:现代系统逐渐从以模型为中心,转变到以数据为中心,因此系统故障的原因,可能在于数据。如同软件调试,在系统源代码或运营时条件定位bug,数据调试的目的,发现数据和操作该数据的系统之间的潜在脱节的原因。本次报告分享数据棱镜,确定数据驱动系统性能下降或故障的和数据相关的根本原因。 【知识概念】:数据调试;数据概要文件;干预 【参考文献】: [1] Galhotra S, Fariha A, Lourenço R, et al. DataPrism: Exposing Disconnect between Data and Systems[C]//Proceedings of the 2022 International Conference on Management of Data. 2022: 217-231. [2] Rezig E K, Cao L, Simonini G, et al. Dagger: a data (not code) debugger[C]//CIDR 2020, 10th Conference on Innovative Data Systems Research, Amsterdam, The Netherlands, January 12-15, 2020, Online Proceedings. 2020. |
范卓娅 |
【题目】:去偏对比学习 【摘要】:对比学习在表示学习中应用广泛,其核心思想是将相似的样本(正例)拉近并将不相似的样本(负例)拉远。但在无监督的场景下,由于无法获取样本的标签,正例通常是由数据增强得到,负例是随机采样得到,可能会存在负例中的样本被采样错误。本次组会介绍一篇NIPS 2020的论文,通过修改损失函数的方式消除采样偏差。 【知识概念】:对比学习;采样偏差 【参考文献】: [1] Chuang C Y, Robinson J, Lin Y C, et al. Debiased contrastive learning[J]. Advances in neural information processing systems, 2020, 33: 8765-8775. |
2022年11月24日 |
会议地点:理工配楼101会议室 |
徐冰冰 |
【题目】:Academic Expert Finding via (k,P)-Core based Embedding over Heterogeneous Graphs 【摘要】:找到特定领域的相关专家对于学术界和工业界是很重要的问题。该论文就是针对学术领域的精准专家推荐问题。整体解决思路就是给定一个用户输入的查询和大量的学术知识(如学术论文),从学者中找到与给定查询和学术知识最相关的专家并进行排名,输出排名结果。本次组会聚焦于问题的背景和解决问题整体的方法流程进行介绍。 【知识概念】:异构图;(k, P)-core子图挖掘算法;对比学习;专家查找 【参考文献】: [1]Xu X, Liu J, Wang Y, et al. Academic Expert Finding via (k, P) -Core based Embedding over Heterogeneous Graphs[C]//2022 IEEE 38th International Conference on Data Engineering (ICDE). IEEE, 2022: 338-351. [2] Kong Y X, Shi G Y, Wu R J, et al. k-core: Theories and applications[J]. Physics Reports, 2019, 832: 1-32. [3] Zhang C, Song D, Huang C, et al. Heterogeneous graph neural network[C]//Proceedings of the 25th ACM SIGKDD international conference on knowledge discovery & data mining. 2019: 793-803. |
李晨阳 |
【题目】:利用时效修复不一致、不完整数据 【摘要】:一致性、完整性以及时效性是影响关系型数据库中数据质量的三个重要问题,然而解决上述问题的方案往往不是相互独立的。由此,时间戳缺失、错乱、不可用会造成更加复杂的数据清洗问题,本次报告旨在为这一问题提供了一种解决思路。 【知识概念】:时效顺序;编辑距离;朴素贝叶斯 【参考文献】: [1] Ding X, Wang H, Su J, et al. Leveraging currency for repairing inconsistent and incomplete data[J]. IEEE Transactions on Knowledge and Data Engineering, 2020. |
2022年11月17日 |
会议地点:理工配楼101会议室 |
艾山 |
【题目】:Active Learning Based Automatic Knowledge Extraction Framework 【摘要】:信息抽取任务是知识图谱构建的核心任务,特别地,在原生零知识资源下信息抽取更加困难,需要大量标注数据,而标注数据耗时且耗力。为了解决标注问题研究者们提出了基于主动学习的信息抽取方法,主动学习的核心是训练模型过程中,由模型自己选择比较有用的样本参与训练,从而提高效率。现有的基于主动学习信息抽取方法中主要考虑了模型选择样本的查询策略,没有充分考虑模型设计和优化策略,然而,基于主动学习的训练是一种递增的训练模式,数据的大小和分布不停地变化,由于数据不停地变化使得固定参数的模型容易过拟合或欠拟合。AutoML 是一种自动化机器学习模型优化的技术,AutoML可以解决以上的模型优化问题。本文提出了基于主动学习和AutoML结合的信息抽取框架ALAIE,我们贡献主要以下两个:首先,提出了主动学习模型的基于AutoML自动模型优化策略,从数据标注和模型优化两方面提升效果;其次,针对主动学习,提出了一种新的不确定性采样和可信选择策略;最后,实验测试并验证了本文框架的有效性,和实验结果表明,我们的框架比普通的主动学习框架标注节省30%人力,总体时间缩短40%。 【知识概念】:主动学习;AutoML 【参考文献】: [1] Han Y, Li C. Entity Matching by Pool-based Active Learning[J]. arXiv preprint arXiv:2211.00311, 2022. [2] Aggarwal U, Popescu A, Hudelot C. Optimizing Active Learning for Low Annotation Budgets[J]. arXiv preprint arXiv:2201.07200, 2022. [3] Li Y, Wang Z, Xie Y, et al. Automl: From methodology to application[C]//Proceedings of the 30th ACM International Conference on Information & Knowledge Management. 2021: 4853-4856. [4] Ren P, Hou W, Sheng M, et al. MKGB: A Medical Knowledge Graph Construction Framework Based on Data Lake and Active Learning[C]//International Conference on Health Information Science. Springer, Cham, 2021: 245-253. |
张旭康 |
【题目】:Orchestrating Data Placement and Query Execution in Heterogeneous CPU-GPU DBMS 【摘要】:由于GPU的大规模并行性和高内存带宽,人们对使用GPU加速数据分析越来越感兴趣。使用GPU进行数据分析的主要限制是GPU内存容量有限。异构CPU-GPU查询执行是缓解GPU内存容量和PCIe带宽有限的一种引人注目的方法。然而,异构CPU-GPU查询执行的设计空间尚未得到充分的探索。 【知识概念】:GPU DBMS;GPU 加速;GPU内存 【参考文献】: [1] 裴威, 李战怀, 潘巍. GPU 数据库核心技术综述[J]. 软件学报, 2021, 32(3): 859-885. [2] Yogatama B W, Gong W, Yu X. Orchestrating data placement and query execution in heterogeneous CPU-GPU DBMS[J]. Proceedings of the VLDB Endowment, 2022, 15(11): 2491-2503. |
2022年11月10日 |
会议地点:理工配楼101会议室 |
刘俊旭 |
【题目】:Practical DP Neural Network Training: Considerations and Strategies 【摘要】:近年来关于复杂深度学习任务与差分隐私技术结合研究涌现出大量的算法和理论工作,然而,在实际应用或实验阶段,往往面临无法在一个合理隐私预算的约束下得到一个可用模型的难题。造成这个问题的原因在于实现DPSGD的两个关键步骤——梯度裁剪与噪声扰动——与训练数据分布和模型训练参数存在千丝万缕的联系,从而影响模型的收敛性。盲目地调参会浪费大量的时间精力并且收效甚微。本次报告将讨论差分隐私保护的深度学习训练中,数据、算法和DP等不同因素对模型效果的影响,同时借助实例,讨论如何在实验中规避这些影响,从而实现更理想的训练效果。 【知识概念】:DPSGD; Fair learning;Pareto frontier 【参考文献】: [1] Kaissis G, Ziller A, Passerat-Palmbach J, et al. End-to-end privacy preserving deep learning on multi-institutional medical imaging[J]. Nature Machine Intelligence, 2021, 3(6): 473-484. [2] Bagdasaryan E, Poursaeed O, Shmatikov V. Differential privacy has disparate impact on model accuracy[J]. Advances in neural information processing systems, 2019, 32. [3] Fan L, Ng K W, Ju C, et al. Rethinking privacy preserving deep learning: How to evaluate and thwart privacy attacks[M]//Federated Learning. Springer, Cham, 2020: 32-50. |
许婧楠 |
【题目】:Qantifying identifiability to choose and audit ε in diferentially private deep learning 【摘要】:隐私预算ε是差分隐私中的一个重要参数,它的取值和数据的可用性有很大关系,所以如何选取一个合适的ε是一个重要的问题。但现有方法中所提出的ε取值大多是在理论条件下计算得出,可能远高于实际所需,所以需要对ε进行审计,判断其取值是否合理。本次汇报的是vldb2022中的一篇文章,与差分隐私的“不可区分(indistinguishable)”不同,从“不可辨别(unidentifiable)”的角度出发,选择合适的ε并进行审计。 【知识概念】:Differential privacy(差分隐私);Differential identifiability(差分可辨性);Adversary advantage(攻击者优势) 【参考文献】: [1] Bernau D, Eibl G, Grassal P W, et al. Quantifying identifiability to choose and audit ϵ in differentially private deep learning[J]. Proceedings of the VLDB Endowment, 2021, 14(13): 3335-3347. |
2022年11月3日 |
会议地点:理工配楼101会议室 |
张旭康 |
【题目】:Orchestrating Data Placement and Query Execution in Heterogeneous CPU-GPU DBMS 【摘要】:由于GPU的大规模并行性和高内存带宽,人们对使用GPU加速数据分析越来越感兴趣。使用GPU进行数据分析的主要限制是GPU内存容量有限。异构CPU-GPU查询执行是缓解GPU内存容量和PCIe带宽有限的一种引人注目的方法。然而,异构CPU-GPU查询执行的设计空间尚未得到充分的探索。 【知识概念】:GPU DBMS;GPU 加速;GPU内存 【参考文献】: [1] 裴威, 李战怀, 潘巍. GPU 数据库核心技术综述[J]. 软件学报, 2021, 32(3): 859-885. [2] Yogatama B W, Gong W, Yu X. Orchestrating data placement and query execution in heterogeneous CPU-GPU DBMS[J]. Proceedings of the VLDB Endowment, 2022, 15(11): 2491-2503. |
但唐朋 |
【题目】:图上的最短距离查询 【摘要】:计算路网(图)中的最短路径距离是一系列实时响应依赖应用中的核心功能。为了能够有效计算此类距离查询,研究者们在理论和实践上做了大量工作。本次组会将和大家分享其中一些具有代表性的工作。 【参考文献】: [1]图论(原书第五版)Reinhard Diestel 著 [2]Li Z, Chen L, Wang Y. G*-tree: An efficient spatial index on road networks[C]//2019 IEEE 35th International Conference on Data Engineering (ICDE). IEEE, 2019: 268-279. [3]Zhang M, Li L, Hua W, et al. Dynamic hub labeling for road networks[C]//2021 IEEE 37th International Conference on Data Engineering (ICDE). IEEE, 2021: 336-347. [4]Zhang M, Li L, Hua W, et al. Efficient 2-hop labeling maintenance in dynamic small-world networks[C]//2021 IEEE 37th International Conference on Data Engineering (ICDE). IEEE, 2021: 133-144. |
2022年10月27日 |
会议地点:理工配楼101会议室 |
刘立新 |
【题目】:Transparent and Privacy-Preserving Data Services 【摘要】:数据透明性是指在大数据价值实现过程中,使所有参与主体均能有效获取与自身相关的全部数据信息。然而,实现透明性也同时会带来隐私泄漏问题。如何兼顾和平衡“透明性”和“隐私保护”是值得探讨的问题。本次报告主要介绍USENIX Security 2023中1篇文章。它提出服务提供者(Service Provider)透明处理多用户数据的方法,同时保护了用户的隐私。该方法可应用于智能电网、数据广告和道路拥挤收费(Congestion Pricing)等要求透明性和隐私保护的场景中。 【知识概念】:数据透明(Data Transparency);非交互零知识证明(Non-Interactive Zero-knowledge Proof);密码学承诺( Cryptographic Commitment );可认证数据结构(Authenticated Data Structures) 【参考文献】: [1] Daniel Reijsbergen, Aung Maw, Zheng Yang, et al. TAP: Transparent and Privacy-Preserving Data Services [C]// USENIX Security 2023 Accepted,https://arxiv.org/abs/2210.11702 [2] Peng Y, Du M, Li F, et al. FalconDB: Blockchain-based collaborative database[C]//Proceedings of the 2020 ACM SIGMOD International Conference on Management of Data. 2020: 637-652. |
李梓童 |
【题目】:Identification for Deep Neural Network: Simply Adjusting Few Weights! [1] Lao Y, Yang P, Zhao W, et al. Identification for Deep Neural Network: Simply Adjusting Few Weights![C]//2022 IEEE 38th International Conference on Data Engineering (ICDE). IEEE, 2022: 1328-1341. [2] Sommer D M, Song L, Wagh S, et al. Towards probabilistic verification of machine unlearning[J]. arXiv preprint arXiv:2003.04247, 2020. |
2022年10月20日 |
会议地点:理工配楼101会议室 |
王雷霞 |
【题目】:Multi-armed bandit for parameter tuning |
彭迎涛 |
【题目】:缓解知识图谱推荐的交互稀疏: 协作指导 & 对比学习 |
2022年10月13日 |
会议地点:理工配楼101会议室 |
王文礼 |
【题目】:稳定学习:因果推断思想在机器学习中的应用 |
郝新丽 |
【题目】:图神经网络在时间序列中的应用 |
2022年10月6日 |
会议地点:理工配楼101会议室 |
范卓娅 |
【题目】:数据库查询中的公平性 |
马超红 |
【题目】:The Price of Tailoring the Index to Your Data: Poisoning A.acks on Learned Index Structures |
2022年9月29日 |
会议地点:理工配楼101会议室 |
徐冰冰 |
【题目】:Cross-lingual Knowledge Graph Alignment via Graph Convolutional Networks |
李晨阳 |
【题目】:时间序列的插补与修复 |
2022年7月11日 |
会议地点:理工配楼101会议室 |
艾山 |
【题目】:Harvesting Knowledge from Pre-trained Language Models |
2022年7月4日 |
会议地点:理工配楼101会议室 |
马超红 |
【题目】:Dynamic Learned Indexes |
刘俊旭 |
【题目】:Tailoring Privacy-preserving with Personalization |
2022年6月27日 |
会议地点:理工配楼101会议室 |
刘立新 |
【题目】:区块链系统的身份隐私保护 |
王雷霞 |
【题目】:Privacy and Security |
2022年6月20日 |
会议地点:理工配楼101会议室 |
范卓娅 |
题目:反事实公平(Counterfactual fairness) |
郝新丽 |
题目:Is attention explainable? |
2022年6月13日 |
会议地点:理工配楼101会议室 |
彭迎涛 |
题目:Adversarial Learning for Fairness aware Recommendation |
张旭康 |
题目:Presto: SQL on Everything |
王文礼 |
题目:Knowledge Graph Reasoning:Methods and Classification |
2022年6月6日 |
会议地点:理工配楼101会议室 |
王文礼 |
题目:Knowledge Graph Reasoning:Methods and Classification |
李梓童 |
题目:On the Necessity of Auditable Algorithmic Definitions for Machine Unlearning |
2022年5月30日 |
会议地点:理工配楼101会议室 |
刘立新 |
题目:区块链系统中的身份隐私保护技术 |
马超红 |
题目:trie-based structures |
2022年5月23日 |
会议地点:理工配楼101会议室 |
刘俊旭 |
题目:How Private for DPSGD? |
王雷霞 |
题目:Byzantine Robust Frequency Estimation in the shuffle model |
2022年5月16日 |
会议地点:理工配楼101会议室 |
郝新丽 |
题目:Explanation Discovery for Anomaly Detection |
2022年5月9日 |
会议地点:理工配楼101会议室 |
张旭康 |
题目:(Distributed Database)In Search of an Understandable Consensus Algorithm |
范卓娅 |
题目:公平数据前处理方法 |
2022年4月25日 |
会议地点:理工配楼101会议室 |
艾山 |
题目:A survey on Knowledge graph construction techniques |
彭迎涛 |
题目:Negative-Sample and Self-Supervised Learning for Knowledge Graph Enhanced Recommendation |
2022年4月18日 |
会议地点:理工配楼101会议室 |
王文礼 |
题目:RNNLOGIC: LEARNING LOGIC RULES FOR REASONING ON KNOWLEDGE GRAPHS |
李梓童 |
题目:Machine unlearning: background, method and classification |
2022年4月11日 |
会议地点:理工配楼101会议室 |
刘立新 |
题目:Blockchain-assisted differentially private aggregation |
马超红 |
题目:Multi-dimensional Learned Index |
2022年4月2日 |
会议地点:理工配楼101会议室 |
刘俊旭 |
题目:机器学习中的个性化隐私保护技术研究 |
王雷霞 |
题目:Sketch Method to Get Differential Privacy for Free |
2022年3月28日 |
会议地点:理工配楼101会议室 |
郝新丽 |
题目:时间序列中的机器学习可解释性研究 |
许婧楠 |
题目:Debugging Differential Privacy: A Case Study for Privacy Auditing |
2022年3月21日 |
会议地点:理工配楼101会议室 |
张旭康 |
题目:Dremel: Interactive Analysis of Web-Scale Datasets |
范卓娅 |
题目:公平表示学习 |
2022年3月14日 |
会议地点:理工配楼101会议室 |
艾山 |
题目:Span-based hypernymy extraction with pre-trained model |
彭迎涛 |
题目:多样化推荐系统方法研究综述 |
2022年3月7日 |
会议地点:理工配楼101会议室 |
王文礼 |
题目:From Unstructured Text to Causal Knowledge Graphs: A Transformer-Based Approach |
李梓童 |
题目:Brief examples of MPC and data deletion applied to privacy protection |

Maintained by WAMDM Administrator() | Copyright © 2007-2017 WAMDM, All rights reserved |