Name		Name	Last commit message	Last commit date
Latest commit History 36 Commits
LLM4RecPart		LLM4RecPart
LLM_Agent_try		LLM_Agent_try
RL-TRL		RL-TRL
Rec-Transformer		Rec-Transformer
images		images
utils		utils
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements_clean.txt		requirements_clean.txt
setup_conda_env.sh		setup_conda_env.sh

Repository files navigation

README

1. 整体框架

998. 备忘录

现在的eval metric用的是HR和NDCG，这两个都是基于字符串匹配的（也就是说reward要单独写）
文件/文件夹名以“temp_”或者“trash_”开头会被自动忽略，更多自动忽略请参见.gitignore

999. TODO

给两种模型各写一个RL，基于各自的eval生成函数进行写，观察它们的生成方式来用一个代码运行起来，别忘了使用参数控制vllm
解决qwen2跑出来结果一坨的问题
Beam Search的时候添加前缀树，增强可控性
把tokenizer改回来，看看qwen是怎么写tokenizer的，看情况可以去掉空格，对齐Onerec-think的输入格式
为train_single添加测试集，便于在训练过程中测试

About

An all-in-one framework to train/fine-tune Generative Recommendation Module. Under developing...

Apache-2.0 license

Custom properties

Report repository

Releases

No releases published

Packages

Contributors

Languages