RoboWaiter/robowaiter/algos/retrieval/retrieval_lm/robot/process_json.py

import json
import jsonlines
import argparse

def train(args):
    filename=args.passages
    with open(filename, 'r', encoding="utf-8") as f:
        k=0
        for line in f:
            data = json.loads(line)
            dict={"id":k,'title':data['title'],'text':data['text']}
            k+=1
            with jsonlines.open("train_robot.jsonl", "a") as file_jsonl:
                file_jsonl.write(dict)

def test(args):
    filename = args.passages
    with open(filename, 'r', encoding="utf-8") as f:
        k=0
        for line in f:
            if k<1000:
                data = json.loads(line)
                dict={"id":data['id'],'question':data['title'],'answers':data['text']}
                k+=1
                with jsonlines.open("test_robot.jsonl", "a") as file_jsonl:
                    file_jsonl.write(dict)

if __name__ == "__main__":
    parser = argparse.ArgumentParser()

    parser.add_argument("--passages", type=str, default=None, help="Path to passages")
    parser.add_argument("--mode", type=str, default=None, help="train or test")

    args = parser.parse_args()

    if args.mode=='train':
        train(args)
    elif args.mode=='test':
        test(args)
    else:
        print("error mode!")
增加了向量数据库 RoboWaiter\robowaiter\llm_client\passage_retrieval3.py 2023-11-23 23:05:23 +08:00			`import json`
			`import jsonlines`
			`import argparse`

			`def train(args):`
			`filename=args.passages`
			`with open(filename, 'r', encoding="utf-8") as f:`
			`k=0`
			`for line in f:`
			`data = json.loads(line)`
			`dict={"id":k,'title':data['title'],'text':data['text']}`
			`k+=1`
			`with jsonlines.open("train_robot.jsonl", "a") as file_jsonl:`
			`file_jsonl.write(dict)`

			`def test(args):`
			`filename = args.passages`
			`with open(filename, 'r', encoding="utf-8") as f:`
			`k=0`
			`for line in f:`
			`if k<1000:`
			`data = json.loads(line)`
			`dict={"id":data['id'],'question':data['title'],'answers':data['text']}`
			`k+=1`
			`with jsonlines.open("test_robot.jsonl", "a") as file_jsonl:`
			`file_jsonl.write(dict)`

			`if __name__ == "__main__":`
			`parser = argparse.ArgumentParser()`

			`parser.add_argument("--passages", type=str, default=None, help="Path to passages")`
			`parser.add_argument("--mode", type=str, default=None, help="train or test")`

			`args = parser.parse_args()`

			`if args.mode=='train':`
			`train(args)`
			`elif args.mode=='test':`
			`test(args)`
			`else:`
			`print("error mode!")`