🆙
5月9日新闻 Environment
太长不看:请用python3.10.6及以上版本,grid editor已经更新
昨天我们惊奇地发现python3.9版本中的ast.unparse函数有bug,在生成字符串时会丢失语法树上的结点。我们对服务器上的python版本进行了测试,发现3.10.6并不存在此问题。所以推荐大家使用python3.10.6以上版本。
grid editor我们也进行了更新,现在grid editor不需要网络连接也可以使用了。
Robot Update
太长不看:已经更新,请git pull拉取最新代码
- 我们彻底删除了namedtuple,推荐大家用内置数据结构吧。
- 我们修改了RobotB,现在RobotB检查代码后,如果代码正确则会保存,如果代码错误则会打印出错误的结果。
做题小技巧
太长不看:AI能力有限,做不出来也没办法
Q: robotb不听话怎么办,我都告诉他需要改哪一行代码了,它都不改。
A: 真没办法
Q: robotA也不听话怎么办?我明明已经把一句话说的很简单的,它还是做不对。 A: 首先,请再检查一下自然语言部分,确保自己没有说错。其次,可能AI真的能力有限,需要大家手动edit 一个subfunction,将其拆成更细的部分。
Q: 如果我debug的时候发现,main函数写错了怎么办? A: 直接edit main就可以,之前生成的函数都会保留下来的。类似的,任意一段你可以看到的代码,都可以通过edit指令修改。
** 提交要求更新 **
今日起,提交log时,请根据以下格式。即为每个task创建一个文件夹,一个task文件夹中应该包含2个log文件 ,如果robotA成功则有一个pkl文件,如果robotB成功则有一个python文件。
大家由于网络问题,可能有很多log。我们的log是按照时间命名的,包含了年月日_时分秒
,大家可以找到对应的log并提交。一般来说,应该是时间上最新的一个文件。
log
|-- task123
| |- task_123_xxxxx.log
| |- task_123_xxxxx.log
| |- task_123_xxxxx.pkl (如果RobotA正确)
| |- btask_123_xxxxx.py (如果RobotB正确)
|
|-- task124
| ...
解题要求
虽然我们的系统只检查了Test,但大家一定要力求Train也正确呀,不要只针对Test写代码。最后我们也会拿生成的代码到train上测试的,test正确率/总正确率越高,说明泛化性越好。