计算机网络 - 链路层
基本问题
1. 封装成帧
将网络层传下来的分组添加首部和尾部,用于标记帧的开始和结束。
整个程序的入口,主要任务是确定调用时参数、连接各模块
train(args, seed, writer=none)
创建环境:env = gym.make('molecule-v0')
这个环境也是源码中定义的,需要安装库gym_molecule,在gym-molecule文件夹内命令行输入pip install -e.
进行安装,在代码开头需要import gym_molecule 来使用 molecule-v0 环境。
定义得出策略方法:
1 | #定义用于从观测中得出策略的函数# |
policy_fn,输入name(用于tf scope命名),ob_space,ac_space ,直接返回一个策略类
调用pposgd_simple_gcn.learn()开始训练
【Part I】
Astro, yeah
欢迎来到Astroworld
这首歌出自Travis Scott专辑AstroWorld,名字来自休斯顿的一座废弃主题乐园,他本人也来自休斯顿。
《Graph Convolutional Policy Network for Goal-Directed Molecular Graph Generation》
这篇论文在github中给出了源码:
https://github.com/bowenliu16/rl_graph_generation
但在环境配置时出现了问题,原因是其中gym的mujoco模块没能成功安装。