#戒断# 那是被欲望支配的生活

总之,不希望过被低级欲望支配的生活。 1

#戒断# 那我们继续看 MFRL 吧

好久不答辩,甚至紧张了… 虽然这一关本来就问题不大的。 那我们继续看 MFRL 吧,1. 搞清楚问题定义,2. 搞清楚 method,3. 重点关注图表。

#戒断# 本来以为 KWIK 是很厉害的技术呢

并不是。是比较 naive 的东西。 anyway 先看一下它的 method。实验就不要看了。 然后赶快去看别的 method,把整个 framework comp up with 出来 1

#戒断# 还是很想进国家实验室

发现 华为 阿里 他们的科研 / 研发岗都是和业务密切相关的,我们组的研究方向貌似不太 match。 我们组研究的东西,或许更偏向国家实验室的方向? 还是很想进国家实验室啊。 2

#戒断# 分解、倒推与最大公约数

是我家长的拿手技能。 毕设先编创新点,然后倒推实验结果,再倒推实验计划。GNN 不必急切匆忙。toefl 正常推进。 路径调研,去看大厂实验室招聘官网和公众号,列出他们在做的方向,总结。

#戒断# …看到了另一个世界

跟社团一块吃饭,男生们有在喝酒。看到了另一个世界,有感而发写了篇博客,粘其中一段话过来: 我是说,感觉看到了一种缩影:这种今朝有酒今朝醉,或是 自以为在做着有意义的事、其实对未来的发展没有帮助,

#戒断# 今日计划

1. 在服务器上用 6sigma 当环境来跑 ppo,使用相同的参数。 2. list 推进。 3. 浅读 14 年()的那篇文章,看看能否叠 KWIK 的 buff。 4. 把两个荣誉报了。( 2

#戒断# 为啥突然就不训练了???

现在换回 6sigma 环境,grad 也全是 none 了。输出结果一成不变。 为什么呢?我记得当时参数没调好的时候,还是在训练的。它至少是在做梯度更新的。 要不重装一下 pytorch 1

#戒断# 四线推进

毕设,GNN,托福,调研工作 / 方向 / 论文发表路径。 目前,毕设和托福正常推进,GNN 搁置一段时间了,调研有点找不到方向。

#戒断# 调出 ddpg 需要注意什么呢?

要不然我直接换成 sac。 (虽然记得自己不太会 sac。sac 是 off-policy 嘛?) 今天上午 10 点去听 63 所宣讲会,中午 12 点赶去吃经管工作餐,然后可能会开始排

合作伙伴

线上在线自习室晚自习。番茄工作法、四象限、打卡、作业清单、作业辅导、作业交流、作业跟踪、作业计划、个人宣传相关内容

行恒 © 行恒 2013