onnx-modifier/onnx_modifier.py

# https://leimao.github.io/blog/ONNX-Python-API/
# https://leimao.github.io/blog/ONNX-IO-Stream/
# https://github.com/saurabh-shandilya/onnx-utils
# https://stackoverflow.com/questions/52402448/how-to-read-individual-layers-weight-bias-values-from-onnx-model

import os
import time
import copy
import struct
import numpy as np
import onnx
from onnx import numpy_helper
from utils import make_new_node, make_attr_changed_node
from utils import parse_tensor, np2onnxdtype

class onnxModifier:
    def __init__(self, model_name, model_proto):
        self.model_name = model_name
        self.model_proto_backup = model_proto
        self.reload()

    @classmethod
    def from_model_path(cls, model_path):
        model_name = os.path.basename(model_path)
        model_proto = onnx.load(model_path)
        return cls(model_name, model_proto)

    @classmethod
    def from_name_stream(cls, name, stream):
        # https://leimao.github.io/blog/ONNX-IO-Stream/
        print("loading model...")
        stream.seek(0)
        model_proto = onnx.load_model(stream, onnx.ModelProto, load_external_data=False)
        print("load done!")
        return cls(name, model_proto)

    def reload(self):
        self.model_proto = copy.deepcopy(self.model_proto_backup)
        self.graph = self.model_proto.graph
        self.initializer = self.model_proto.graph.initializer

        self.gen_name2module_map()

    def gen_name2module_map(self):
        # node name => node
        self.node_name2module = dict()
        node_idx = 0
        for node in self.graph.node:
            if node.name == '':
                node.name = str(node.op_type) + str(node_idx)
            node_idx += 1
            self.node_name2module[node.name] = node

        for inp in self.graph.input:
            self.node_name2module[inp.name] = inp
        self.graph_input_names = [inp.name for inp in self.graph.input]

        for out in self.graph.output:
            self.node_name2module["out_" + out.name] = out  # add `out_` in case the output has the same name with the last node
        self.graph_output_names = ["out_" + out.name for out in self.graph.output]
        # print(self.node_name2module.keys())

        # initializer name => initializer
        self.initializer_name2module = dict()
        for initializer in self.initializer:
            self.initializer_name2module[initializer.name] = initializer

    def change_batch_size(self, rebatch_info):
        if not (rebatch_info): return
        # https://github.com/onnx/onnx/issues/2182#issuecomment-881752539
        rebatch_type = rebatch_info['type']
        rebatch_value = rebatch_info['value']
        if type == 'fixed':
            rebatch_value = int(rebatch_value)
        # print(rebatch_type, rebatch_value)

        # Change batch size in input, output and value_info
        for tensor in list(self.graph.input) + list(self.graph.value_info) + list(self.graph.output):
            tensor.type.tensor_type.shape.dim[0].dim_param = rebatch_value

        # handle reshapes
        for node in self.graph.node:
            if node.op_type != 'Reshape':
                continue
            for init in self.graph.initializer:
                # node.input[1] is expected to be a reshape
                if init.name != node.input[1]:
                    continue

                v = rebatch_value if rebatch_type == 'fixed' else -1
                # Shape is stored as a list of ints
                if len(init.int64_data) > 0:
                    # This overwrites bias nodes' reshape shape but should be fine
                    init.int64_data[0] = v
                # Shape is stored as bytes
                elif len(init.raw_data) > 0:
                    shape = bytearray(init.raw_data)
                    struct.pack_into('q', shape, 0, v)
                    init.raw_data = bytes(shape)

    def remove_node_by_name(self, node_name):
        # remove node in graph
        self.graph.node.remove(self.node_name2module[node_name])

    def remove_model_output_by_name(self, node_name):
        self.graph.output.remove(self.node_name2module[node_name])

    def remove_node_by_node_states(self, node_states):
        # remove node from graph
        for node_name, node_state in node_states.items():
            if not (node_name in self.node_name2module):
                # for custom added node here
                continue
            if node_state == 'Deleted':
                if node_name in self.graph_output_names:
                    # print('removing output {} ...'.format(node_name))
                    self.remove_model_output_by_name(node_name)
                else:
                    # print('removing node {} ...'.format(node_name))
                    self.remove_node_by_name(node_name)

        remained_node_inputs = []
        for remained_node in self.graph.node:
            remained_node_inputs += remained_node.input

        # remove node initializers (parameters), aka, keep and only keep the initializers of remained nodes
        for init_name in self.initializer_name2module.keys():
            if not init_name in remained_node_inputs:
                self.initializer.remove(self.initializer_name2module[init_name])

        # remove the (model) inputs related to deleted nodes
        # https://github.com/ZhangGe6/onnx-modifier/issues/12
        for input_name in self.graph_input_names:
            if not input_name in remained_node_inputs:
                self.graph.input.remove(self.node_name2module[input_name])

    def modify_node_io_name(self, node_renamed_io):
        for node_name in node_renamed_io.keys():
            if node_name not in self.node_name2module.keys():
                # custom added nodes or custom added model outputs, or the deleted nodes
                continue
            renamed_ios = node_renamed_io[node_name]
            for src_name, dst_name in renamed_ios.items():
                node = self.node_name2module[node_name]
                if node_name in self.graph_input_names:
                    node.name = dst_name
                elif node_name in self.graph_output_names:
                    node.name = dst_name
                else:
                    # print(node.input, node.output)
                    for i in range(len(node.input)):
                        if node.input[i] == src_name:
                            node.input[i] = dst_name
                    for i in range(len(node.output)):
                        if node.output[i] == src_name:
                            node.output[i] = dst_name

                    # rename the corresponding initializer and update initializer_name2module
                    if src_name in self.initializer_name2module.keys():
                        init = self.initializer_name2module[src_name]
                        init.name = dst_name
                        self.initializer_name2module[dst_name] = init
                        del self.initializer_name2module[src_name]

    def modify_node_attr(self, node_changed_attr):
        # we achieve it by deleting the original node and make a (copied) new node
        # print(node_changed_attr)
        for node_name in node_changed_attr.keys():
            orig_node = self.node_name2module[node_name]
            attr_changed_node = make_attr_changed_node(orig_node, node_changed_attr[node_name])
            self.graph.node.remove(self.node_name2module[node_name])
            self.graph.node.append(attr_changed_node)

            # update the node_name2module
            del self.node_name2module[node_name]
            self.node_name2module[node_name] = attr_changed_node

    def add_nodes(self, nodes_info, node_states):
        for node_info in nodes_info.values():
            if node_states[node_info['properties']['name']] == "Deleted":
                continue
            print(node_info)
            node = make_new_node(node_info)
            # print(node)

            self.graph.node.append(node)

    def add_outputs(self, added_outputs):
        # https://github.com/onnx/onnx/issues/3277#issuecomment-1050600445
        added_output_names = added_outputs.values()
        if len(added_output_names) == 0: return
        # filter out the deleted custom-added outputs
        value_info_protos = []
        shape_info = onnx.shape_inference.infer_shapes(self.model_proto)
        print(added_output_names)
        for value_info in shape_info.graph.value_info:
            print(value_info.name)
            if value_info.name in added_output_names:
                value_info_protos.append(value_info)
        self.graph.output.extend(value_info_protos)

    def modify_initializer(self, changed_initializer):
        # print(changed_initializer)
        for init_name, meta in changed_initializer.items():
            # https://github.com/onnx/onnx/issues/2978
            init_type, init_val_str = meta
            if init_val_str == "": continue # in case we clear the input
            # print(init_name, init_type, init_val)
            init_val = parse_tensor(init_val_str, init_type)
            # print(init_val)
            # for primary initilizers
            if init_name in self.initializer_name2module.keys():
                tensor = numpy_helper.from_array(init_val, init_name)
                self.initializer_name2module[init_name].CopyFrom(tensor)
            # for custom added initilizers
            else:
                initializer_tensor = onnx.helper.make_tensor(
                    name=init_name,
                    data_type=np2onnxdtype(init_val.dtype),
                    dims=init_val.shape,
                    vals=init_val)
                # print(initializer_tensor)
                self.initializer.append(initializer_tensor)
                self.initializer_name2module[init_name] = initializer_tensor

    def post_process(self):
        def remove_isolated_nodes():
            # remove the remained corresponding isolated nodes, like Constant
            remained_node_inputs, remained_node_outputs = [], []
            for remained_node in self.graph.node:
                remained_node_inputs += remained_node.input
                remained_node_outputs += remained_node.output

            for remained_node in self.graph.node:
                # delete the node if it does not serve as the input or output of any other nodes
                unused = True
                for output in remained_node.output:
                    if output in remained_node_inputs:
                        unused = False
                        break
                for input in remained_node.input:
                    if input in remained_node_outputs:
                        unused = False
                        break
                if unused:
                    self.graph.node.remove(self.node_name2module[remained_node.name])
                    for inp in remained_node.input:
                        if inp in self.initializer_name2module.keys():
                            self.initializer.remove(self.initializer_name2module[inp])

        remove_isolated_nodes()

    def modify(self, modify_info):
        '''
        1. Some functions, such as modify_initializer(), should be placed
        before modify_node_io_name(), to avoid name mismatch error.
        2. add_nodes() should be placed at the first place, otherwise
        remove_node_by_node_states() will delete the initializer of
        newly added nodes mistakenly
        '''
        # print(modify_info['node_states'])
        # print(modify_info['node_renamed_io'])
        # print(modify_info['node_changed_attr'])
        # print(modify_info['added_node_info'])
        # print(modify_info['added_outputs'])

        self.add_nodes(modify_info['added_node_info'], modify_info['node_states'])
        self.modify_initializer(modify_info['changed_initializer'])
        self.change_batch_size(modify_info['rebatch_info'])
        self.remove_node_by_node_states(modify_info['node_states'])
        self.modify_node_io_name(modify_info['node_renamed_io'])
        self.modify_node_attr(modify_info['node_changed_attr'])
        self.add_outputs(modify_info['added_outputs'])

        self.post_process()

    def check_and_save_model(self, save_dir='./modified_onnx'):
        print("saving model...")
        if not os.path.exists(save_dir):
            os.mkdir(save_dir)
        save_path = os.path.join(save_dir, 'modified_' + self.model_name)

        # adding new node like self.add_nodes() and self.modify_node_attr() can not guarantee the nodes are topologically sorted
        # so `onnx.onnx_cpp2py_export.checker.ValidationError: Nodes in a graph must be topologically sorted` will be invoked
        # I turn off the onnx checker as a workaround.
        # onnx.checker.check_model(self.model_proto)
        onnx.save(self.model_proto, save_path)
        print("model saved in {} !".format(save_dir))

    def inference(self, input_shape=[1, 3, 224, 224], x=None, output_names=None):
        import onnxruntime as rt
        model_proto_bytes = onnx._serialize(self.model_proto)
        inference_session = rt.InferenceSession(model_proto_bytes)

        if not x:
            np.random.seed(0)
            x = np.random.randn(*input_shape).astype(np.float32)
        if not output_names:
            output_name = self.graph.node[-1].output[0]
            # output_value_info = onnx.helper.make_tensor_value_info(output_name, onnx.TensorProto.INT64, shape=[])
            output_value_info = onnx.helper.make_tensor_value_info(output_name, onnx.TensorProto.FLOAT, shape=[])
            self.graph.output.append(output_value_info)
            output_names = [inference_session.get_outputs()[0].name]

        input_name = inference_session.get_inputs()[0].name
        out = inference_session.run(output_names, {input_name: x})[0]
        print(out.shape)
        # print(out[0][0][0][0])

if __name__ == "__main__":
    # model_path = "C:\\Users\\ZhangGe\\Desktop\\resnet18-v2-7.onnx"
    # model_path = "C:\\Users\\ZhangGe\\Desktop\\movenet_lightning.onnx"
    # model_path = "C:\\Users\\ZhangGe\\Desktop\\test_edit_init.onnx"
    # model_path = "C:\\Users\\ZhangGe\\Desktop\\modified_test_edit_init.onnx"
    # model_path = "C:\\Users\\ZhangGe\\Desktop\\test_edit_init.onnx"
    model_path = "C:\\Users\\ZhangGe\\Desktop\\tiny_squeezenet1.0-3.onnx"
    onnx_modifier = onnxModifier.from_model_path(model_path)

    def explore_basic():
        print(type(onnx_modifier.model_proto.graph.initializer))
        print(dir(onnx_modifier.model_proto.graph.initializer))

        print(len(onnx_modifier.model_proto.graph.node))
        print(len(onnx_modifier.model_proto.graph.initializer))

        for node in onnx_modifier.model_proto.graph.node:
            print(node.name)
            print(node.input)
            print()

        # for initializer in onnx_modifier.model_proto.graph.initializer:
        #     print(initializer.name)
        # print(onnx_modifier.model_proto.graph.initializer['fire9/concat_1_scale'])
        pass
    # explore_basic()

    def remove_node_by_node_states():
        # print(len(onnx_modifier.graph.node))
        # print(len(onnx_modifier.graph.initializer))

        # print(onnx_modifier.node_name2module.keys())
        # print(onnx_modifier.graph.node)
        # for node in onnx_modifier.graph.node:
        #     print(node.name)
        #     print(node.input)
        #     print(node.output)


        node_states = {'input': 'Exist', 'Conv_0': 'Exist', 'Conv_95': 'Exist', 'Clip_96': 'Deleted', 'GlobalAveragePool_97': 'Deleted', 'Shape_98': 'Deleted', 'Gather_100': 'Deleted', 'Unsqueeze_101': 'Deleted', 'Concat_102': 'Deleted', 'Reshape_103': 'Deleted', 'Gemm_104': 'Deleted', 'out_output': 'Deleted'}
        # print('\graph  input')
        # for inp in onnx_modifier.graph.input:
        #     print(inp.name)
        onnx_modifier.remove_node_by_node_states(node_states)
        # print(len(onnx_modifier.graph.node))
        # print(len(onnx_modifier.graph.initializer))
        # print(len(onnx_modifier.initializer_name2module.keys()))

        for node in onnx_modifier.graph.node:
            print(node.name)
            print(node.input, node.output)
        for initializer in onnx_modifier.initializer:
            print(initializer.name)

        # print('\nleft nodes:')
        # for node in onnx_modifier.graph.node:
        #     print(node.name)

        # print('\nleft input')
        # for inp in onnx_modifier.graph.input:
        #     print(inp.name)

        onnx_modifier.check_and_save_model()
    # remove_node_by_node_states()

    def test_modify_node_io_name():
        node_rename_io = {'input': {'input': 'inputd'}, 'Conv_0': {'input': 'inputd'}}
        onnx_modifier.modify_node_io_name(node_rename_io)
        onnx_modifier.check_and_save_model()
    # test_modify_node_io_name()

    def test_add_node():
        node_info = {'custom_added_AveragePool0': {'properties': {'domain': 'ai.onnx', 'op_type': 'AveragePool', 'name': 'custom_added_AveragePool0'}, 'attributes': {'kernel_shape': [2, 2]}, 'inputs': {'X': ['fire2/squeeze1x1_1']}, 'outputs': {'Y': ['out']}}}

        onnx_modifier.add_nodes(node_info)

        onnx_modifier.inference(input_shape=[1, 1, 192, 192], output_names=["onnx::Transpose_368"])
        onnx_modifier.check_and_save_model()
    # test_add_node()

    def test_change_node_attr():
        # changed_attr = {'Clip_3': {'max': 5}}
        changed_attr = {'Conv_2': {'group': 64}}

        onnx_modifier.modify_node_attr(changed_attr)

        onnx_modifier.check_and_save_model()
    # test_change_node_attr()

    def test_inference():
        onnx_modifier.inference(input_shape=[1, 1, 192, 192], output_names=["onnx::Transpose_368"])
    # test_inference()

    def test_add_output():
        # print(onnx_modifier.graph.output)
        onnx_modifier.add_outputs({'0': 'out'})
        print(onnx_modifier.graph.output)
        onnx_modifier.check_and_save_model()
    # test_add_output()

    def test_change_batch_size():
        onnx_modifier.inference(input_shape=(1, 3, 640, 640))
        print("batch size 1 passed")

        onnx_modifier.reload()
        onnx_modifier.change_batch_size({'type': 'fixed', 'value': '2'})
        onnx_modifier.inference(input_shape=(2, 3, 640, 640))
        print("batch size 2 passed")

        onnx_modifier.reload()
        onnx_modifier.change_batch_size({'type': 'dynamic', 'value': 'dynamic'})
        onnx_modifier.inference(input_shape=(6, 3, 640, 640))
        print("batch size dynamic passed")

        onnx_modifier.check_and_save_model()
    # test_change_batch_size()

    def test_modify_primary_initializer():
        onnx_modifier.inference(input_shape=[1, 1, 192, 192], output_names=['onnx::Transpose_368'])
        onnx_modifier.modify_initializer({'onnx::Reshape_367': ['int64', '[1, 2, 32, 24, 6]']})
        onnx_modifier.inference(input_shape=[1, 1, 192, 192], output_names=['onnx::Transpose_368'])
    # test_modify_primary_initializer()

    def test_modify_new_initializer():
        modify_info = {'node_states': {'input': 'Exist', 'Conv_0': 'Exist', 'LeakyRelu_1': 'Exist', 'Conv_2': 'Exist', 'LeakyRelu_3': 'Exist', 'Conv_4': 'Exist', 'LeakyRelu_5': 'Exist', 'Conv_6': 'Exist', 'LeakyRelu_7': 'Exist', 'Conv_8': 'Exist', 'LeakyRelu_9': 'Exist', 'Conv_10': 'Exist', 'Conv_11': 'Exist', 'LeakyRelu_12': 'Exist', 'Conv_13': 'Exist', 'Conv_14': 'Exist', 'LeakyRelu_15': 'Exist', 'Conv_16': 'Exist', 'Concat_17': 'Exist', 'LeakyRelu_18': 'Exist', 'Conv_19': 'Exist', 'Sigmoid_20': 'Exist', 'Mul_22': 'Exist', 'Conv_23': 'Exist', 'LeakyRelu_24': 'Exist', 'Conv_25': 'Exist', 'Conv_26': 'Exist', 'LeakyRelu_27': 'Exist', 'Conv_28': 'Exist', 'Add_29': 'Exist', 'Conv_30': 'Exist', 'Conv_31': 'Exist', 'LeakyRelu_32': 'Exist', 'Conv_33': 'Exist', 'Conv_34': 'Exist', 'LeakyRelu_35': 'Exist', 'Conv_36': 'Exist', 'Concat_37': 'Exist', 'LeakyRelu_38': 'Exist', 'Conv_39': 'Exist', 'Conv_40': 'Exist', 'LeakyRelu_41': 'Exist', 'Conv_42': 'Exist', 'LeakyRelu_43': 'Exist', 'Conv_44': 'Exist', 'Conv_45': 'Exist', 'LeakyRelu_46': 'Exist', 'Concat_47': 'Exist', 'Reshape_49': 'Exist', 'out_onnx::Transpose_368': 'Exist', 'custom_added_Slice0': 'Exist'}, 'node_renamed_io': {}, 'node_changed_attr': {}, 'added_node_info': {'custom_added_Slice0': {'properties': {'domain': 'ai.onnx', 'op_type': 'Slice', 'name': 'custom_added_Slice0'}, 'attributes': {}, 'inputs': {'data': ['custom_input_0'], 'starts': ['custom_input_1'], 'ends': ['custom_input_2'], 'output': ['custom_output_5']}, 'outputs': {}}}, 'added_outputs': {}, 'rebatch_info': {}, 'changed_initializer': {'custom_input_1': ['int64', '[0,0,0,0]'], 'custom_input_2': ['int64', '[1,1,192,192]']}}
        onnx_modifier.modify(modify_info)
        onnx_modifier.check_and_save_model()
        onnx_modifier.inference(input_shape=[1, 1, 192, 192], output_names=['custom_output_2'])
        # print(onnx_modifier.initializer_name2module.keys())
        # for initializer in onnx_modifier.initializer:
        #     print(f"Tensor Name: {initializer.name}, Data Type: {initializer.data_type}, Shape: {initializer.dims}")
    # test_modify_new_initializer()

    def test_remove_isolated_nodes():
        modify_info = {'node_states': {'data_0': 'Exist', 'Conv0': 'Exist', 'Relu1': 'Exist', 'MaxPool2': 'Exist', 'Conv3': 'Exist', 'Relu4': 'Exist', 'Conv5': 'Exist', 'Relu6': 'Exist', 'Conv7': 'Exist', 'Relu8': 'Exist', 'Concat9': 'Exist', 'Conv10': 'Exist'}, 'node_renamed_io': {'Conv3': {'pool1_1': 'conv1_2'}, 'MaxPool2': {'conv1_2': 'conv1'}}, 'node_changed_attr': {}, 'added_node_info': {}, 'added_outputs': {}, 'rebatch_info': {}, 'changed_initializer': {}}
        onnx_modifier.modify(modify_info)
        onnx_modifier.check_and_save_model()
    test_remove_isolated_nodes()