1.环境搭建完成

2.相关的工具类编写完成
3.配置文件管理类编写完成
zxr
劝酒千百 9 months ago
parent a2f187e99a
commit 6af3585137

@ -4,7 +4,7 @@
<option name="autoReloadType" value="ALL" />
</component>
<component name="ChangeListManager">
<list default="true" id="a7505764-040b-48e2-b2fc-8c5b579e595f" name="Default" comment="1.环境搭建完成&#10;2.相关的工具类编写完成11&#10;3.配置文件管理类编写完成1" />
<list default="true" id="a7505764-040b-48e2-b2fc-8c5b579e595f" name="Default" comment="1.环境搭建完成&#10;2.相关的工具类编写完成&#10;3.配置文件管理类编写完成" />
<option name="SHOW_DIALOG" value="false" />
<option name="HIGHLIGHT_CONFLICTS" value="true" />
<option name="HIGHLIGHT_NON_ACTIVE_CHANGELIST" value="false" />
@ -479,6 +479,7 @@
<workItem from="1734365941294" duration="2674000" />
<workItem from="1734368738786" duration="983000" />
<workItem from="1734369961357" duration="171000" />
<workItem from="1734370148794" duration="42000" />
</task>
<task id="LOCAL-00001" summary="1.环境搭建完成&#10;2.相关的工具类编写完成&#10;3.配置文件管理类编写完成">
<created>1529592741848</created>
@ -638,7 +639,15 @@
<option name="project" value="LOCAL" />
<updated>1734370121454</updated>
</task>
<option name="localTasksCounter" value="21" />
<task id="LOCAL-00021" summary="1.环境搭建完成&#10;2.相关的工具类编写完成&#10;3.配置文件管理类编写完成">
<option name="closed" value="true" />
<created>1734370179773</created>
<option name="number" value="00021" />
<option name="presentableId" value="LOCAL-00021" />
<option name="project" value="LOCAL" />
<updated>1734370179773</updated>
</task>
<option name="localTasksCounter" value="22" />
<servers />
</component>
<component name="TestHistory">
@ -763,10 +772,10 @@
<MESSAGE value="1.环境搭建完成11&#10;2.相关的工具类编写完成1&#10;3.配置文件管理类编写完成1" />
<MESSAGE value="1.环境搭建完成&#10;2.相关的工具类编写完成&#10;3.配置文件管理类编写完成11" />
<MESSAGE value="1.环境搭建完成11&#10;2.相关的工具类编写完成11&#10;3.配置文件管理类编写完成11" />
<MESSAGE value="1.环境搭建完成&#10;2.相关的工具类编写完成&#10;3.配置文件管理类编写完成" />
<MESSAGE value="1.环境搭建完成&#10;2.相关的工具类编写完成&#10;3.配置文件管理类编写完成1" />
<MESSAGE value="1.环境搭建完成&#10;2.相关的工具类编写完成11&#10;3.配置文件管理类编写完成1" />
<option name="LAST_COMMIT_MESSAGE" value="1.环境搭建完成&#10;2.相关的工具类编写完成11&#10;3.配置文件管理类编写完成1" />
<MESSAGE value="1.环境搭建完成&#10;2.相关的工具类编写完成&#10;3.配置文件管理类编写完成" />
<option name="LAST_COMMIT_MESSAGE" value="1.环境搭建完成&#10;2.相关的工具类编写完成&#10;3.配置文件管理类编写完成" />
</component>
<component name="editorHistoryManager">
<entry file="file://$PROJECT_DIR$/src/main/java/cn/edu/hust/conf/ConfigurationManager.java">

@ -2063,11 +2063,7 @@ public class UserVisitAnalyze {
//3. 获取session的明细数据保存到数据库
JavaPairRDD<String, Tuple2<String, Row>> sessionDetailRDD = top10CategorySessionRDD.join(sessionInfoPairRDD);
// 对top10CategorySessionRDD前面经过一系列处理得到的与排名前10的品类会话相关的RDD其键值对类型为<String, String>,从前面代码逻辑推测键可能是会话相关信息,值是对应信息字符串)
// 和sessionInfoPairRDD包含完整会话信息的RDD键值对类型为<String, Row>键是会话ID值是包含多个字段的Row类型的会话详细数据行进行连接join操作。
// 连接的目的是将排名前10的品类会话相关信息与完整的会话详细数据进行整合生成一个新的JavaPairRDD<String, Tuple2<String, Row>>类型的sessionDetailRDD
// 其键为某个用于关联的标识从前面逻辑推测可能与会话相关值是一个包含两个元素的Tuple2第一个元素是字符串可能是前面top10品类会话相关的部分信息第二个元素是Row类型的完整会话详细数据
// 方便后续基于整合后的数据提取出需要持久化到数据库的详细会话信息。
sessionDetailRDD.foreachPartition(new VoidFunction<Iterator<Tuple2<String, Tuple2<String, Row>>>>() {
// 调用sessionDetailRDD的foreachPartition方法传入一个实现了VoidFunction接口的匿名内部类实例
@ -2076,88 +2072,61 @@ public class UserVisitAnalyze {
@Override
public void call(Iterator<Tuple2<String, Tuple2<String, Row>>> tuple2Iterator) throws Exception {
// 重写了VoidFunction接口中的call方法当foreachPartition方法遍历每个分区时会针对每个分区对应的迭代器Iterator<Tuple2<String, Tuple2<String, Row>>>类型其中元素是包含会话相关信息的复杂键值对调用这个call方法
// 参数tuple2Iterator就是当前正在处理的那个分区对应的迭代器通过它可以遍历该分区内的所有元素每个元素是Tuple2<String, Tuple2<String, Row>>类型的键值对)进行具体的数据提取和处理操作。
List<SessionDetail> sessionDetailList = new ArrayList<SessionDetail>();
// 创建一个名为sessionDetailList的ArrayList列表用于存放SessionDetail类型的对象
// SessionDetail应该是自定义的用于封装要持久化到数据库的详细会话信息的实体类后续会将从分区数据中提取出来的各个会话的详细信息封装成此类对象添加到这个列表中
// 以便进行批量插入数据库的操作。
while (tuple2Iterator.hasNext()) {
// 通过调用迭代器tuple2Iterator的hasNext方法判断当前分区内是否还有未处理的元素即Tuple2<String, Tuple2<String, Row>>类型的键值对),如果有则进入循环进行处理。
Tuple2<String, Tuple2<String, Row>> tuple2 = tuple2Iterator.next();
// 调用迭代器tuple2Iterator的next方法获取下一个要处理的元素键值对并赋值给tuple2变量
// tuple2的类型为Tuple2<String, Tuple2<String, Row>>其第一个元素tuple2._1可能是会话相关的标识信息第二个元素tuple2._2是一个包含字符串和Row类型数据的Tuple2
// 后续将从这个复杂的结构中提取出具体的会话详细字段信息进行封装。
Row row = tuple2._2._2;
// 从tuple2的值部分即Tuple2<String, Row>类型的元素中获取第二个元素也就是Row类型的数据赋值给row变量
// Row类型通常代表一行包含多个字段的会话详细数据后续将从这个row中提取出各个具体的字段信息用于构建SessionDetail对象。
String sessionId = tuple2._1;
// 从tuple2中获取其键部分也就是前面提到的可能与会话相关的标识信息赋值给sessionId变量这里将其作为会话的ID信息
// 后续会把这个会话ID设置到SessionDetail对象中确保数据的完整性和关联性。
Long userId = row.getLong(1);
// 从row数据行中获取索引为1的字段从代码上下文推测该字段存储的是用户ID信息不过具体要结合数据结构定义确定并将其转换为Long类型赋值给userId变量
// 用于后续将用户ID信息封装到SessionDetail对象中记录该会话对应的用户情况。
Long pageId = row.getLong(3);
// 从row数据行中获取索引为3的字段推测该字段存储的是页面ID等相关信息具体依据数据结构定义转换为Long类型后赋值给pageId变量
// 以便将页面相关信息添加到SessionDetail对象中完善会话详细信息的记录。
String actionTime = row.getString(4);
// 从row数据行中获取索引为4的字段可能是会话操作时间等相关信息依据数据结构而定赋值给actionTime变量
// 后续会把这个时间信息设置到SessionDetail对象中用于记录会话发生的时间情况。
String searchKeyWard = row.getString(5);
// 从row数据行中获取索引为5的字段可能是搜索关键词等相关信息根据实际数据结构来确定赋值给searchKeyWard变量
// 用于将搜索相关情况添加到SessionDetail对象中更全面地记录会话的详细内容。
Long clickCategoryId = row.getLong(6);
// 从row数据行中获取索引为6的字段推测是点击品类的ID信息结合前面代码逻辑判断转换为Long类型后赋值给clickCategoryId变量
// 这样就能把点击品类相关信息纳入到SessionDetail对象中记录会话中涉及的品类点击情况。
Long clickProducetId = row.getLong(7);
// 从row数据行中获取索引为7的字段可能是点击产品的ID信息根据数据结构定义赋值给clickProducetId变量
// 以便在SessionDetail对象中记录点击产品的相关情况丰富会话详细信息的内容。
String orderCategoryId = row.getString(8);
// 从row数据行中获取索引为8的字段推测是下单品类的ID相关信息从整体业务逻辑推测赋值给orderCategoryId变量
// 后续会将下单品类信息添加到SessionDetail对象中用于记录会话中涉及的下单品类情况。
String orderProducetId = row.getString(9);
// 从row数据行中获取索引为9的字段可能是下单产品的ID相关信息依据数据结构确定赋值给orderProducetId变量
// 以便把下单产品相关情况设置到SessionDetail对象中更完整地记录会话中下单相关的详细信息。
String payCategoryId = row.getString(10);
// 从row数据行中获取索引为10的字段推测是支付品类的ID相关信息结合业务逻辑判断赋值给payCategoryId变量
// 用于将支付品类信息纳入到SessionDetail对象中记录会话中涉及的支付品类情况。
String payProducetId = row.getString(11);
// 从row数据行中获取索引为11的字段可能是支付产品的ID相关信息根据数据结构定义赋值给payProducetId变量
// 这样就能在SessionDetail对象中记录支付产品的相关情况完善会话详细信息的记录使其包含会话涉及的各种业务行为相关的详细信息。
SessionDetail sessionDetail = new SessionDetail();
// 创建一个SessionDetail类型的对象sessionDetail此类是用于封装完整会话详细信息的自定义实体类接下来将把前面提取到的各个字段信息设置到这个对象中。
sessionDetail.set(taskId, userId, sessionId, pageId, actionTime, searchKeyWard, clickCategoryId, clickProducetId, orderCategoryId, orderProducetId, payCategoryId, payProducetId);
// 调用sessionDetail对象的set方法假设SessionDetail类有此方法用于设置对象的各个属性值
// 将外部传入的任务IDtaskId以及前面提取出来的用户ID、会话ID、页面ID、操作时间、搜索关键词、点击品类ID、点击产品ID、下单品类ID、下单产品ID、支付品类ID、支付产品ID等信息设置到sessionDetail对象中
// 完成对该对象的属性赋值操作,使其封装好了当前会话的完整详细信息,准备添加到列表中进行批量插入数据库操作。
sessionDetailList.add(sessionDetail);
// 将封装好数据的sessionDetail对象添加到sessionDetailList列表中通过循环不断添加最终这个列表将包含当前分区内所有会话的完整详细信息对象
// 待整个分区的数据都处理完后,就可以进行批量插入数据库的操作了。
}
DaoFactory.getSessionDetailDao().batchInsert(sessionDetailList);
// 通过DaoFactory应该是自定义的数据访问工厂类用于获取数据库操作相关的DAO对象的getSessionDetailDao方法
// 获取到用于操作SessionDetail数据的DAO对象然后调用其batchInsert方法
// 将包含要持久化数据的sessionDetailList列表传入实现将当前分区内所有会话的详细信息批量插入到数据库中的功能
// 完成对每个分区数据的持久化操作,整个流程遍历完所有分区后,就将所有相关会话的详细信息都保存到数据库中了。
}
});
}

Loading…
Cancel
Save