[Datumaro] Add cvat format export (#1034)

* Add cvat format export * Remove wrong items in test
7 years ago · 8da20b38d5
parent 43c5fd0088
commit 8da20b38d5
3 changed files with 461 additions and 1 deletions
--- a/datumaro/datumaro/components/converters/init.py
+++ b/datumaro/datumaro/components/converters/init.py
@ -25,6 +25,7 @@ from datumaro.components.converters.voc import (
 from datumaro.components.converters.yolo import YoloConverter
 from datumaro.components.converters.tfrecord import DetectionApiConverter
 from datumaro.components.converters.cvat import CvatConverter
 items = [
@ -47,4 +48,6 @@ items = [
    ('yolo', YoloConverter),
    ('tf_detection_api', DetectionApiConverter),
    ('cvat', CvatConverter),
 ]
--- a/datumaro/datumaro/components/converters/cvat.py
+++ b/datumaro/datumaro/components/converters/cvat.py
@ -0,0 +1,337 @@
 # Copyright (C) 2019 Intel Corporation
 #
 # SPDX-License-Identifier: MIT
 from collections import OrderedDict
 import os
 import os.path as osp
 from xml.sax.saxutils import XMLGenerator
 from datumaro.components.converter import Converter
 from datumaro.components.extractor import DEFAULT_SUBSET_NAME, AnnotationType
 from datumaro.components.formats.cvat import CvatPath
 from datumaro.util.image import save_image
 def pairwise(iterable):
    a = iter(iterable)
    return zip(a, a)
 class XmlAnnotationWriter:
    VERSION = '1.1'
    def __init__(self, f):
        self.xmlgen = XMLGenerator(f, 'utf-8')
        self._level = 0
    def _indent(self, newline = True):
        if newline:
            self.xmlgen.ignorableWhitespace('\n')
        self.xmlgen.ignorableWhitespace('  ' * self._level)
    def _add_version(self):
        self._indent()
        self.xmlgen.startElement('version', {})
        self.xmlgen.characters(self.VERSION)
        self.xmlgen.endElement('version')
    def open_root(self):
        self.xmlgen.startDocument()
        self.xmlgen.startElement('annotations', {})
        self._level += 1
        self._add_version()
    def _add_meta(self, meta):
        self._level += 1
        for k, v in meta.items():
            if isinstance(v, OrderedDict):
                self._indent()
                self.xmlgen.startElement(k, {})
                self._add_meta(v)
                self._indent()
                self.xmlgen.endElement(k)
            elif isinstance(v, list):
                self._indent()
                self.xmlgen.startElement(k, {})
                for tup in v:
                    self._add_meta(OrderedDict([tup]))
                self._indent()
                self.xmlgen.endElement(k)
            else:
                self._indent()
                self.xmlgen.startElement(k, {})
                self.xmlgen.characters(v)
                self.xmlgen.endElement(k)
        self._level -= 1
    def write_meta(self, meta):
        self._indent()
        self.xmlgen.startElement('meta', {})
        self._add_meta(meta)
        self._indent()
        self.xmlgen.endElement('meta')
    def open_track(self, track):
        self._indent()
        self.xmlgen.startElement('track', track)
        self._level += 1
    def open_image(self, image):
        self._indent()
        self.xmlgen.startElement('image', image)
        self._level += 1
    def open_box(self, box):
        self._indent()
        self.xmlgen.startElement('box', box)
        self._level += 1
    def open_polygon(self, polygon):
        self._indent()
        self.xmlgen.startElement('polygon', polygon)
        self._level += 1
    def open_polyline(self, polyline):
        self._indent()
        self.xmlgen.startElement('polyline', polyline)
        self._level += 1
    def open_points(self, points):
        self._indent()
        self.xmlgen.startElement('points', points)
        self._level += 1
    def add_attribute(self, attribute):
        self._indent()
        self.xmlgen.startElement('attribute', {'name': attribute['name']})
        self.xmlgen.characters(attribute['value'])
        self.xmlgen.endElement('attribute')
    def _close_element(self, element):
        self._level -= 1
        self._indent()
        self.xmlgen.endElement(element)
    def close_box(self):
        self._close_element('box')
    def close_polygon(self):
        self._close_element('polygon')
    def close_polyline(self):
        self._close_element('polyline')
    def close_points(self):
        self._close_element('points')
    def close_image(self):
        self._close_element('image')
    def close_track(self):
        self._close_element('track')
    def close_root(self):
        self._close_element('annotations')
        self.xmlgen.endDocument()
 class _SubsetWriter:
    def __init__(self, file, name, extractor, context):
        self._writer = XmlAnnotationWriter(file)
        self._name = name
        self._extractor = extractor
        self._context = context
    def write(self):
        self._writer.open_root()
        self._write_meta()
        for item in self._extractor:
            if self._context._save_images:
                self._save_image(item)
            self._write_item(item)
        self._writer.close_root()
    def _save_image(self, item):
        image = item.image
        if image is None:
            return
        image_path = osp.join(self._context._images_dir,
            str(item.id) + CvatPath.IMAGE_EXT)
        save_image(image_path, image)
    def _write_item(self, item):
        h, w = 0, 0
        if item.has_image:
            h, w = item.image.shape[:2]
        self._writer.open_image(OrderedDict([
            ("id", str(item.id)),
            ("name", str(item.id)),
            ("width", str(w)),
            ("height", str(h))
        ]))
        for ann in item.annotations:
            if ann.type in {AnnotationType.points, AnnotationType.polyline,
                    AnnotationType.polygon, AnnotationType.bbox}:
                self._write_shape(ann)
            else:
                continue
        self._writer.close_image()
    def _write_meta(self):
        label_cat = self._extractor.categories()[AnnotationType.label]
        meta = OrderedDict([
            ("task", OrderedDict([
                ("id", ""),
                ("name", self._name),
                ("size", str(len(self._extractor))),
                ("mode", "annotation"),
                ("overlap", ""),
                ("start_frame", "0"),
                ("stop_frame", str(len(self._extractor))),
                ("frame_filter", ""),
                ("z_order", "True"),
                ("labels", [
                    ("label", OrderedDict([
                        ("name", label.name),
                        ("attributes", [
                            ("attribute", OrderedDict([
                                ("name", attr),
                                ("mutable", "True"),
                                ("input_type", "text"),
                                ("default_value", ""),
                                ("values", ""),
                            ])) for attr in label.attributes
                        ])
                    ])) for label in label_cat.items
                ]),
            ])),
        ])
        self._writer.write_meta(meta)
    def _get_label(self, label_id):
        label_cat = self._extractor.categories()[AnnotationType.label]
        return label_cat.items[label_id]
    def _write_shape(self, shape):
        if shape.label is None:
            return
        shape_data = OrderedDict([
            ("label", self._get_label(shape.label).name),
            ("occluded", str(int(shape.attributes.get('occluded', False)))),
        ])
        points = shape.get_points()
        if shape.type == AnnotationType.bbox:
            shape_data.update(OrderedDict([
                ("xtl", "{:.2f}".format(points[0])),
                ("ytl", "{:.2f}".format(points[1])),
                ("xbr", "{:.2f}".format(points[2])),
                ("ybr", "{:.2f}".format(points[3]))
            ]))
        else:
            shape_data.update(OrderedDict([
                ("points", ';'.join((
                    ','.join((
                        "{:.2f}".format(x),
                        "{:.2f}".format(y)
                    )) for x, y in pairwise(points))
                )),
            ]))
        shape_data['z_order'] = str(int(shape.attributes.get('z_order', 0)))
        if shape.group is not None:
            shape_data['group_id'] = str(shape.group)
        if shape.type == AnnotationType.bbox:
            self._writer.open_box(shape_data)
        elif shape.type == AnnotationType.polygon:
            self._writer.open_polygon(shape_data)
        elif shape.type == AnnotationType.polyline:
            self._writer.open_polyline(shape_data)
        elif shape.type == AnnotationType.points:
            self._writer.open_points(shape_data)
        else:
            raise NotImplementedError("unknown shape type")
        for attr_name, attr_value in shape.attributes.items():
            if attr_name in self._get_label(shape.label).attributes:
                self._writer.add_attribute(OrderedDict([
                    ("name", str(attr_name)),
                    ("value", str(attr_value)),
                ]))
        if shape.type == AnnotationType.bbox:
            self._writer.close_box()
        elif shape.type == AnnotationType.polygon:
            self._writer.close_polygon()
        elif shape.type == AnnotationType.polyline:
            self._writer.close_polyline()
        elif shape.type == AnnotationType.points:
            self._writer.close_points()
        else:
            raise NotImplementedError("unknown shape type")
 class _Converter:
    def __init__(self, extractor, save_dir, save_images=False):
        self._extractor = extractor
        self._save_dir = save_dir
        self._save_images = save_images
    def convert(self):
        os.makedirs(self._save_dir, exist_ok=True)
        images_dir = osp.join(self._save_dir, CvatPath.IMAGES_DIR)
        os.makedirs(images_dir, exist_ok=True)
        self._images_dir = images_dir
        annotations_dir = osp.join(self._save_dir, CvatPath.ANNOTATIONS_DIR)
        os.makedirs(annotations_dir, exist_ok=True)
        self._annotations_dir = annotations_dir
        subsets = self._extractor.subsets()
        if len(subsets) == 0:
            subsets = [ None ]
        for subset_name in subsets:
            if subset_name:
                subset = self._extractor.get_subset(subset_name)
            else:
                subset_name = DEFAULT_SUBSET_NAME
                subset = self._extractor
            with open(osp.join(annotations_dir, '%s.xml' % subset_name), 'w') as f:
                writer = _SubsetWriter(f, subset_name, subset, self)
                writer.write()
 class CvatConverter(Converter):
    def __init__(self, save_images=False, cmdline_args=None):
        super().__init__()
        self._options = {
            'save_images': save_images,
        }
        if cmdline_args is not None:
            self._options.update(self._parse_cmdline(cmdline_args))
    @classmethod
    def build_cmdline_parser(cls, parser=None):
        import argparse
        if not parser:
            parser = argparse.ArgumentParser()
        parser.add_argument('--save-images', action='store_true',
            help="Save images (default: %(default)s)")
        return parser
    def __call__(self, extractor, save_dir):
        converter = _Converter(extractor, save_dir, **self._options)
        converter.convert()
--- a/datumaro/tests/test_cvat_format.py
+++ b/datumaro/tests/test_cvat_format.py
@ -10,6 +10,8 @@ from datumaro.components.extractor import (Extractor, DatasetItem,
    LabelCategories,
 )
 from datumaro.components.importers.cvat import CvatImporter
 from datumaro.components.converters.cvat import CvatConverter
 from datumaro.components.project import Project
 import datumaro.components.formats.cvat as Cvat
 from datumaro.util.image import save_image
 from datumaro.util.test_utils import TestDir
@ -145,4 +147,122 @@ class CvatExtractorTest(TestCase):
                for item_a, item_b in zip(source_subset, parsed_subset):
                    self.assertEqual(len(item_a.annotations), len(item_b.annotations))
                    for ann_a, ann_b in zip(item_a.annotations, item_b.annotations):
-                        self.assertEqual(ann_a, ann_b)
+                        self.assertEqual(ann_a, ann_b)
 class CvatConverterTest(TestCase):
    def _test_save_and_load(self, source_dataset, converter, test_dir,
            importer_params=None, target_dataset=None):
        converter(source_dataset, test_dir.path)
        if not importer_params:
            importer_params = {}
        project = Project.import_from(test_dir.path, 'cvat', **importer_params)
        parsed_dataset = project.make_dataset()
        if target_dataset is not None:
            source_dataset = target_dataset
        self.assertListEqual(
            sorted(source_dataset.subsets()),
            sorted(parsed_dataset.subsets()),
        )
        self.assertEqual(len(source_dataset), len(parsed_dataset))
        for subset_name in source_dataset.subsets():
            source_subset = source_dataset.get_subset(subset_name)
            parsed_subset = parsed_dataset.get_subset(subset_name)
            self.assertEqual(len(source_subset), len(parsed_subset))
            for idx, (item_a, item_b) in enumerate(
                    zip(source_subset, parsed_subset)):
                self.assertEqual(item_a, item_b, str(idx))
    def test_can_save_and_load(self):
        label_categories = LabelCategories()
        for i in range(10):
            label_categories.add(str(i))
        label_categories.items[2].attributes.update(['a1', 'a2'])
        label_categories.attributes.update(['z_order', 'occluded'])
        class SrcTestExtractor(Extractor):
            def __iter__(self):
                return iter([
                    DatasetItem(id=0, subset='s1', image=np.zeros((5, 10, 3)),
                        annotations=[
                            PolygonObject([0, 0, 4, 0, 4, 4],
                                label=1, group=4,
                                attributes={ 'occluded': True }),
                            PolygonObject([5, 0, 9, 0, 5, 5],
                                label=2, group=4,
                                attributes={ 'unknown': 'bar' }),
                            PointsObject([1, 1, 3, 2, 2, 3],
                                label=2,
                                attributes={ 'a1': 'x', 'a2': 42 }),
                        ]
                    ),
                    DatasetItem(id=1, subset='s1',
                        annotations=[
                            PolyLineObject([0, 0, 4, 0, 4, 4],
                                label=3, id=4, group=4),
                            BboxObject(5, 0, 1, 9,
                                label=3, id=4, group=4),
                        ]
                    ),
                    DatasetItem(id=0, subset='s2', image=np.zeros((5, 10, 3)),
                        annotations=[
                            PolygonObject([0, 0, 4, 0, 4, 4],
                                label=3, group=4,
                                attributes={ 'z_order': 1, 'occluded': False }),
                            PolyLineObject([5, 0, 9, 0, 5, 5]), # will be skipped
                        ]
                    ),
                ])
            def categories(self):
                return { AnnotationType.label: label_categories }
        class DstTestExtractor(Extractor):
            def __iter__(self):
                return iter([
                    DatasetItem(id=0, subset='s1', image=np.zeros((5, 10, 3)),
                        annotations=[
                            PolygonObject([0, 0, 4, 0, 4, 4],
                                label=1, group=4,
                                attributes={ 'z_order': 0, 'occluded': True }),
                            PolygonObject([5, 0, 9, 0, 5, 5],
                                label=2, group=4,
                                attributes={ 'z_order': 0, 'occluded': False }),
                            PointsObject([1, 1, 3, 2, 2, 3],
                                label=2,
                                attributes={ 'z_order': 0, 'occluded': False,
                                    'a1': 'x', 'a2': '42' }),
                        ]
                    ),
                    DatasetItem(id=1, subset='s1',
                        annotations=[
                            PolyLineObject([0, 0, 4, 0, 4, 4],
                                label=3, group=4,
                                attributes={ 'z_order': 0, 'occluded': False }),
                            BboxObject(5, 0, 1, 9,
                                label=3, group=4,
                                attributes={ 'z_order': 0, 'occluded': False }),
                        ]
                    ),
                    DatasetItem(id=0, subset='s2', image=np.zeros((5, 10, 3)),
                        annotations=[
                            PolygonObject([0, 0, 4, 0, 4, 4],
                                label=3, group=4,
                                attributes={ 'z_order': 1, 'occluded': False }),
                        ]
                    ),
                ])
            def categories(self):
                return { AnnotationType.label: label_categories }
        with TestDir() as test_dir:
            self._test_save_and_load(SrcTestExtractor(),
                CvatConverter(save_images=True), test_dir,
                target_dataset=DstTestExtractor())