matching_dependency/settings.py

from sentence_transformers import SentenceTransformer

ltable_path = r'E:\Data\Research\Projects\matching_dependency\datasets\DBLP-GoogleScholar\tableA.csv'
rtable_path = r'E:\Data\Research\Projects\matching_dependency\datasets\DBLP-GoogleScholar\tableB.csv'
mapping_path = r'E:\Data\Research\Projects\matching_dependency\datasets\DBLP-GoogleScholar\matches.csv'
mapping_lid = 'idDBLP'  # mapping表中左表id名
mapping_rid = 'idScholar'  # mapping表中右表id名
ltable_block_attr = 'title'
rtable_block_attr = 'title'
ltable_id = 'id'  # 左表id字段名称
rtable_id = 'id'  # 右表id字段名称
target_attr = 'id'  # 进行md挖掘时的目标字段
# lr_attrs_map = {}  # 如果两个表中存在对应字段名称不一样的情况，将名称加入列表便于调整一致

model = SentenceTransformer('E:\\Data\\Research\\Models\\all-MiniLM-L6-v2')
interpre_weight = 1  # 可解释性权重
similarity_threshold = 0.1
support_threshold = 1
confidence_threshold = 0.75

er_output_dir = 'E:\\Data\\Research\\Projects\\matching_dependency\\ml_er\\output\\'
md_output_dir = 'E:\\Data\\Research\\Projects\\matching_dependency\\md_discovery\\output\\'
hpo_output_dir = 'E:\\Data\\Research\\Projects\\matching_dependency\\hpo\\output\\'
FUCK 1 year ago			`from sentence_transformers import SentenceTransformer`

随机生成MD并过滤 8 months ago			`ltable_path = r'E:\Data\Research\Projects\matching_dependency\datasets\DBLP-GoogleScholar\tableA.csv'`
			`rtable_path = r'E:\Data\Research\Projects\matching_dependency\datasets\DBLP-GoogleScholar\tableB.csv'`
			`mapping_path = r'E:\Data\Research\Projects\matching_dependency\datasets\DBLP-GoogleScholar\matches.csv'`
			`mapping_lid = 'idDBLP' # mapping表中左表id名`
			`mapping_rid = 'idScholar' # mapping表中右表id名`
			`ltable_block_attr = 'title'`
			`rtable_block_attr = 'title'`
9.24 1 year ago			`ltable_id = 'id' # 左表id字段名称`
			`rtable_id = 'id' # 右表id字段名称`
			`target_attr = 'id' # 进行md挖掘时的目标字段`
11.9 1 year ago			`# lr_attrs_map = {} # 如果两个表中存在对应字段名称不一样的情况，将名称加入列表便于调整一致`
11.13 1 year ago
将blocking阶段单拎出来; 重写了MD挖掘代码(后续要改成随机生成加过滤) 8 months ago			`model = SentenceTransformer('E:\\Data\\Research\\Models\\all-MiniLM-L6-v2')`
画图 11 months ago			`interpre_weight = 1 # 可解释性权重`
固定MD挖掘的阈值，使用训练集挖掘MD 使用GPU穷举后采样挖掘法 1 year ago			`similarity_threshold = 0.1`
			`support_threshold = 1`
随机生成MD并过滤 8 months ago			`confidence_threshold = 0.75`
11.13 1 year ago
FUCK 1 year ago			`er_output_dir = 'E:\\Data\\Research\\Projects\\matching_dependency\\ml_er\\output\\'`
			`md_output_dir = 'E:\\Data\\Research\\Projects\\matching_dependency\\md_discovery\\output\\'`
1.所有相似度计算依靠GPU 2.迭代轮数自动识别 3.超参数优化结果落盘 1 year ago			`hpo_output_dir = 'E:\\Data\\Research\\Projects\\matching_dependency\\hpo\\output\\'`
11.13 1 year ago