Project import simple implementation (#3790)

4 years ago · 579bfb38c3
parent cde33acf5d
commit 579bfb38c3
53 changed files with 1941 additions and 361 deletions
--- a/CHANGELOG.md
+++ b/CHANGELOG.md
@ -21,6 +21,7 @@ and this project adheres to [Semantic Versioning](https://semver.org/spec/v2.0.0
 - Data sorting option (<https://github.com/openvinotoolkit/cvat/pull/3937>)
 - Options to change font size & position of text labels on the canvas (<https://github.com/openvinotoolkit/cvat/pull/3972>)
 - Add "tag" return type for automatic annotation in Nuclio (<https://github.com/openvinotoolkit/cvat/pull/3896>)
 - Dataset importing to a project (<https://github.com/openvinotoolkit/cvat/pull/3790>)
 - User is able to customize information that text labels show (<https://github.com/openvinotoolkit/cvat/pull/4029>)
 ### Changed
--- a/cvat-core/package-lock.json
+++ b/cvat-core/package-lock.json
@ -1,12 +1,12 @@
 {
  "name": "cvat-core",
-  "version": "3.21.1",
+  "version": "3.22.0",
  "lockfileVersion": 2,
  "requires": true,
  "packages": {
    "": {
      "name": "cvat-core",
-      "version": "3.21.1",
+      "version": "3.22.0",
      "license": "MIT",
      "dependencies": {
        "axios": "^0.21.4",
--- a/cvat-core/package.json
+++ b/cvat-core/package.json
@ -1,6 +1,6 @@
 {
  "name": "cvat-core",
-  "version": "3.21.1",
+  "version": "3.22.0",
  "description": "Part of Computer Vision Tool which presents an interface for client-side integration",
  "main": "babel.config.js",
  "scripts": {
--- a/cvat-core/src/annotations.js
+++ b/cvat-core/src/annotations.js
@ -284,6 +284,22 @@
        return result;
    }
    function importDataset(instance, format, file, updateStatusCallback = () => {}) {
        if (!(typeof format === 'string')) {
            throw new ArgumentError('Format must be a string');
        }
        if (!(instance instanceof Project)) {
            throw new ArgumentError('Instance should be a Project instance');
        }
        if (!(typeof updateStatusCallback === 'function')) {
            throw new ArgumentError('Callback should be a function');
        }
        if (!(['application/zip', 'application/x-zip-compressed'].includes(file.type))) {
            throw new ArgumentError('File should be file instance with ZIP extension');
        }
        return serverProxy.projects.importDataset(instance.id, format, file, updateStatusCallback);
    }
    function undoActions(session, count) {
        const sessionType = session instanceof Task ? 'task' : 'job';
        const cache = getCache(sessionType);
@ -366,6 +382,7 @@
        importAnnotations,
        exportAnnotations,
        exportDataset,
        importDataset,
        undoActions,
        redoActions,
        freezeHistory,
--- a/cvat-core/src/project-implementation.js
+++ b/cvat-core/src/project-implementation.js
@ -7,7 +7,7 @@
    const { getPreview } = require('./frames');
    const { Project } = require('./project');
-    const { exportDataset } = require('./annotations');
+    const { exportDataset, importDataset } = require('./annotations');
    function implementProject(projectClass) {
        projectClass.prototype.save.implementation = async function () {
@ -61,11 +61,20 @@
        };
        projectClass.prototype.annotations.exportDataset.implementation = async function (
-            format, saveImages, customName,
+            format,
            saveImages,
            customName,
        ) {
            const result = exportDataset(this, format, customName, saveImages);
            return result;
        };
        projectClass.prototype.annotations.importDataset.implementation = async function (
            format,
            file,
            updateStatusCallback,
        ) {
            return importDataset(this, format, file, updateStatusCallback);
        };
        return projectClass;
    }
--- a/cvat-core/src/project.js
+++ b/cvat-core/src/project.js
@ -244,6 +244,7 @@
            // So, we need return it
            this.annotations = {
                exportDataset: Object.getPrototypeOf(this).annotations.exportDataset.bind(this),
                importDataset: Object.getPrototypeOf(this).annotations.importDataset.bind(this),
            };
        }
@ -310,6 +311,16 @@
                        );
                        return result;
                    },
                    async importDataset(format, file, updateStatusCallback = null) {
                        const result = await PluginRegistry.apiWrapper.call(
                            this,
                            Project.prototype.annotations.importDataset,
                            format,
                            file,
                            updateStatusCallback,
                        );
                        return result;
                    },
                },
                writable: true,
            }),
--- a/cvat-core/src/server-proxy.js
+++ b/cvat-core/src/server-proxy.js
@ -514,6 +514,44 @@
                };
            }
            async function importDataset(id, format, file, onUpdate) {
                const { backendAPI } = config;
                const url = `${backendAPI}/projects/${id}/dataset`;
                const formData = new FormData();
                formData.append('dataset_file', file);
                return new Promise((resolve, reject) => {
                    async function requestStatus() {
                        try {
                            const response = await Axios.get(`${url}?action=import_status`, {
                                proxy: config.proxy,
                            });
                            if (response.status === 202) {
                                if (onUpdate && response.data.message !== '') {
                                    onUpdate(response.data.message, response.data.progress || 0);
                                }
                                setTimeout(requestStatus, 3000);
                            } else if (response.status === 201) {
                                resolve();
                            } else {
                                reject(generateError(response));
                            }
                        } catch (error) {
                            reject(generateError(error));
                        }
                    }
                    Axios.post(`${url}?format=${format}`, formData, {
                        proxy: config.proxy,
                    }).then(() => {
                        setTimeout(requestStatus, 2000);
                    }).catch((error) => {
                        reject(generateError(error));
                    });
                });
            }
            async function exportTask(id) {
                const { backendAPI } = config;
                const url = `${backendAPI}/tasks/${id}`;
@ -577,7 +615,7 @@
                                const response = await Axios.get(`${backendAPI}/tasks/${id}/status`);
                                if (['Queued', 'Started'].includes(response.data.state)) {
                                    if (response.data.message !== '') {
-                                        onUpdate(response.data.message);
+                                        onUpdate(response.data.message, response.data.progress || 0);
                                    }
                                    setTimeout(checkStatus, 1000);
                                } else if (response.data.state === 'Finished') {
@ -637,7 +675,7 @@
                let response = null;
-                onUpdate('The task is being created on the server..');
+                onUpdate('The task is being created on the server..', null);
                try {
                    response = await Axios.post(`${backendAPI}/tasks`, JSON.stringify(taskSpec), {
                        proxy: config.proxy,
@ -649,7 +687,7 @@
                    throw generateError(errorData);
                }
-                onUpdate('The data are being uploaded to the server 0%');
+                onUpdate('The data are being uploaded to the server..', null);
                async function chunkUpload(taskId, file) {
                    return new Promise((resolve, reject) => {
@ -1438,6 +1476,7 @@
                            create: createProject,
                            delete: deleteProject,
                            exportDataset: exportDataset('projects'),
                            importDataset,
                        }),
                        writable: false,
                    },
--- a/cvat-ui/package-lock.json
+++ b/cvat-ui/package-lock.json
@ -1,12 +1,12 @@
 {
  "name": "cvat-ui",
-  "version": "1.29.0",
+  "version": "1.30.0",
  "lockfileVersion": 2,
  "requires": true,
  "packages": {
    "": {
      "name": "cvat-ui",
-      "version": "1.29.0",
+      "version": "1.30.0",
      "license": "MIT",
      "dependencies": {
        "@ant-design/icons": "^4.6.3",
--- a/cvat-ui/package.json
+++ b/cvat-ui/package.json
@ -1,6 +1,6 @@
 {
  "name": "cvat-ui",
-  "version": "1.29.0",
+  "version": "1.30.0",
  "description": "CVAT single-page application",
  "main": "src/index.tsx",
  "scripts": {
--- a/cvat-ui/src/actions/import-actions.ts
+++ b/cvat-ui/src/actions/import-actions.ts
@ -0,0 +1,59 @@
 // Copyright (C) 2021 Intel Corporation
 //
 // SPDX-License-Identifier: MIT
 import { createAction, ActionUnion, ThunkAction } from 'utils/redux';
 import { CombinedState } from 'reducers/interfaces';
 import { getProjectsAsync } from './projects-actions';
 export enum ImportActionTypes {
    OPEN_IMPORT_MODAL = 'OPEN_IMPORT_MODAL',
    CLOSE_IMPORT_MODAL = 'CLOSE_IMPORT_MODAL',
    IMPORT_DATASET = 'IMPORT_DATASET',
    IMPORT_DATASET_SUCCESS = 'IMPORT_DATASET_SUCCESS',
    IMPORT_DATASET_FAILED = 'IMPORT_DATASET_FAILED',
    IMPORT_DATASET_UPDATE_STATUS = 'IMPORT_DATASET_UPDATE_STATUS',
 }
 export const importActions = {
    openImportModal: (instance: any) => createAction(ImportActionTypes.OPEN_IMPORT_MODAL, { instance }),
    closeImportModal: () => createAction(ImportActionTypes.CLOSE_IMPORT_MODAL),
    importDataset: (projectId: number) => (
        createAction(ImportActionTypes.IMPORT_DATASET, { id: projectId })
    ),
    importDatasetSuccess: () => (
        createAction(ImportActionTypes.IMPORT_DATASET_SUCCESS)
    ),
    importDatasetFailed: (instance: any, error: any) => (
        createAction(ImportActionTypes.IMPORT_DATASET_FAILED, {
            instance,
            error,
        })
    ),
    importDatasetUpdateStatus: (progress: number, status: string) => (
        createAction(ImportActionTypes.IMPORT_DATASET_UPDATE_STATUS, { progress, status })
    ),
 };
 export const importDatasetAsync = (instance: any, format: string, file: File): ThunkAction => (
    async (dispatch, getState) => {
        try {
            const state: CombinedState = getState();
            if (state.import.importingId !== null) {
                throw Error('Only one importing of dataset allowed at the same time');
            }
            dispatch(importActions.importDataset(instance.id));
            await instance.annotations.importDataset(format, file, (message: string, progress: number) => (
                dispatch(importActions.importDatasetUpdateStatus(progress * 100, message))
            ));
        } catch (error) {
            dispatch(importActions.importDatasetFailed(instance, error));
            return;
        }
        dispatch(importActions.importDatasetSuccess());
        dispatch(getProjectsAsync({ id: instance.id }));
    }
 );
 export type ImportActions = ActionUnion<typeof importActions>;
--- a/cvat-ui/src/actions/tasks-actions.ts
+++ b/cvat-ui/src/actions/tasks-actions.ts
@ -414,8 +414,8 @@ export function createTaskAsync(data: any): ThunkAction<Promise<void>, {}, {}, A
        dispatch(createTask());
        try {
-            const savedTask = await taskInstance.save((status: string): void => {
+            const savedTask = await taskInstance.save((status: string, progress: number): void => {
-                dispatch(createTaskUpdateStatus(status));
+                dispatch(createTaskUpdateStatus(status + (progress !== null ? ` ${Math.floor(progress * 100)}%` : '')));
            });
            dispatch(createTaskSuccess(savedTask.id));
        } catch (error) {
--- a/cvat-ui/src/components/export-dataset/export-dataset-modal.tsx
+++ b/cvat-ui/src/components/export-dataset/export-dataset-modal.tsx
@ -55,7 +55,7 @@ function ExportDatasetModal(): JSX.Element {
    useEffect(() => {
        initActivities();
-    }, [instance?.id, instance instanceof core.classes.Project]);
+    }, [instance?.id, instance instanceof core.classes.Project, taskExportActivities, projectExportActivities]);
    const closeModal = (): void => {
        form.resetFields();
--- a/cvat-ui/src/components/import-dataset-modal/import-dataset-modal.tsx
+++ b/cvat-ui/src/components/import-dataset-modal/import-dataset-modal.tsx
@ -0,0 +1,153 @@
 // Copyright (C) 2021 Intel Corporation
 //
 // SPDX-License-Identifier: MIT
 import './styles.scss';
 import React, { useCallback, useState } from 'react';
 import { useDispatch, useSelector } from 'react-redux';
 import Modal from 'antd/lib/modal';
 import Form from 'antd/lib/form';
 import Text from 'antd/lib/typography/Text';
 import Select from 'antd/lib/select';
 import Notification from 'antd/lib/notification';
 import message from 'antd/lib/message';
 import Upload, { RcFile } from 'antd/lib/upload';
 import {
    DownloadOutlined, InboxOutlined, LoadingOutlined, QuestionCircleFilled,
 } from '@ant-design/icons';
 import CVATTooltip from 'components/common/cvat-tooltip';
 import { CombinedState } from 'reducers/interfaces';
 import { importActions, importDatasetAsync } from 'actions/import-actions';
 import ImportDatasetStatusModal from './import-dataset-status-modal';
 type FormValues = {
    selectedFormat: string | undefined;
 };
 function ImportDatasetModal(): JSX.Element {
    const [form] = Form.useForm();
    const [file, setFile] = useState<File | null>(null);
    const modalVisible = useSelector((state: CombinedState) => state.import.modalVisible);
    const instance = useSelector((state: CombinedState) => state.import.instance);
    const currentImportId = useSelector((state: CombinedState) => state.import.importingId);
    const importers = useSelector((state: CombinedState) => state.formats.annotationFormats.loaders);
    const dispatch = useDispatch();
    const closeModal = useCallback((): void => {
        form.resetFields();
        setFile(null);
        dispatch(importActions.closeImportModal());
    }, [form]);
    const handleImport = useCallback(
        (values: FormValues): void => {
            if (file === null) {
                Notification.error({
                    message: 'No dataset file selected',
                });
                return;
            }
            dispatch(importDatasetAsync(instance, values.selectedFormat as string, file));
            closeModal();
            Notification.info({
                message: 'Dataset export started',
                description: `Dataset import was started for project #${instance?.id}. `,
                className: 'cvat-notification-notice-import-dataset-start',
            });
        },
        [instance?.id, file],
    );
    return (
        <>
            <Modal
                title={(
                    <>
                        <Text>Import dataset to project</Text>
                        <CVATTooltip
                            title={
                                instance && !instance.labels.length ?
                                    'Labels will be imported from dataset' :
                                    'Labels from project will be used'
                            }
                        >
                            <QuestionCircleFilled className='cvat-modal-import-header-question-icon' />
                        </CVATTooltip>
                    </>
                )}
                visible={modalVisible}
                onCancel={closeModal}
                onOk={() => form.submit()}
                className='cvat-modal-import-dataset'
            >
                <Form
                    name='Import dataset'
                    form={form}
                    initialValues={{ selectedFormat: undefined } as FormValues}
                    onFinish={handleImport}
                >
                    <Form.Item
                        name='selectedFormat'
                        label='Export format'
                        rules={[{ required: true, message: 'Format must be selected' }]}
                    >
                        <Select placeholder='Select dataset format' className='cvat-modal-import-select'>
                            {importers
                                .sort((a: any, b: any) => a.name.localeCompare(b.name))
                                .filter(
                                    (importer: any): boolean => (
                                        instance !== null &&
                                        (!instance?.dimension || importer.dimension === instance.dimension)
                                    ),
                                )
                                .map(
                                    (importer: any): JSX.Element => {
                                        const pending = currentImportId !== null;
                                        const disabled = !importer.enabled || pending;
                                        return (
                                            <Select.Option
                                                value={importer.name}
                                                key={importer.name}
                                                disabled={disabled}
                                                className='cvat-modal-import-dataset-option-item'
                                            >
                                                <DownloadOutlined />
                                                <Text disabled={disabled}>{importer.name}</Text>
                                                {pending && <LoadingOutlined style={{ marginLeft: 10 }} />}
                                            </Select.Option>
                                        );
                                    },
                                )}
                        </Select>
                    </Form.Item>
                    <Upload.Dragger
                        listType='text'
                        fileList={file ? [file] : ([] as any[])}
                        beforeUpload={(_file: RcFile): boolean => {
                            if (!['application/zip', 'application/x-zip-compressed'].includes(_file.type)) {
                                message.error('Only ZIP archive is supported');
                            } else {
                                setFile(_file);
                            }
                            return false;
                        }}
                        onRemove={() => {
                            setFile(null);
                        }}
                    >
                        <p className='ant-upload-drag-icon'>
                            <InboxOutlined />
                        </p>
                        <p className='ant-upload-text'>Click or drag file to this area</p>
                    </Upload.Dragger>
                </Form>
            </Modal>
            <ImportDatasetStatusModal />
        </>
    );
 }
 export default React.memo(ImportDatasetModal);
--- a/cvat-ui/src/components/import-dataset-modal/import-dataset-status-modal.tsx
+++ b/cvat-ui/src/components/import-dataset-modal/import-dataset-status-modal.tsx
@ -0,0 +1,34 @@
 // Copyright (C) 2021 Intel Corporation
 //
 // SPDX-License-Identifier: MIT
 import './styles.scss';
 import React from 'react';
 import { useSelector } from 'react-redux';
 import Modal from 'antd/lib/modal';
 import Alert from 'antd/lib/alert';
 import Progress from 'antd/lib/progress';
 import { CombinedState } from 'reducers/interfaces';
 function ImportDatasetStatusModal(): JSX.Element {
    const currentImportId = useSelector((state: CombinedState) => state.import.importingId);
    const progress = useSelector((state: CombinedState) => state.import.progress);
    const status = useSelector((state: CombinedState) => state.import.status);
    return (
        <Modal
            title={`Importing a dataset for the project #${currentImportId}`}
            visible={currentImportId !== null}
            closable={false}
            footer={null}
            className='cvat-modal-import-dataset-status'
            destroyOnClose
        >
            <Progress type='circle' percent={progress} />
            <Alert message={status} type='info' />
        </Modal>
    );
 }
 export default React.memo(ImportDatasetStatusModal);
--- a/cvat-ui/src/components/import-dataset-modal/styles.scss
+++ b/cvat-ui/src/components/import-dataset-modal/styles.scss
@ -0,0 +1,32 @@
 // Copyright (C) 2021 Intel Corporation
 //
 // SPDX-License-Identifier: MIT
@import '../../base.scss';
 .cvat-modal-import-dataset-option-item > .ant-select-item-option-content,
 .cvat-modal-import-select .ant-select-selection-item {
    > span[role='img'] {
        color: $info-icon-color;
        margin-right: $grid-unit-size;
    }
 }
 .cvat-modal-import-header-question-icon {
    margin-left: $grid-unit-size;
    color: $text-color-secondary;
 }
 .cvat-modal-import-dataset-status .ant-modal-body {
    display: flex;
    align-items: center;
    flex-flow: column;
    .ant-progress {
        margin-bottom: $grid-unit-size * 2;
    }
    .ant-alert {
        width: 100%;
    }
 }
--- a/cvat-ui/src/components/project-page/project-page.tsx
+++ b/cvat-ui/src/components/project-page/project-page.tsx
@ -21,6 +21,7 @@ import TaskItem from 'components/tasks-page/task-item';
 import SearchField from 'components/search-field/search-field';
 import MoveTaskModal from 'components/move-task-modal/move-task-modal';
 import ModelRunnerDialog from 'components/model-runner-modal/model-runner-dialog';
 import ImportDatasetModal from 'components/import-dataset-modal/import-dataset-modal';
 import { useDidUpdateEffect } from 'utils/hooks';
 import DetailsComponent from './details';
 import ProjectTopBar from './top-bar';
@ -171,6 +172,7 @@ export default function ProjectPageComponent(): JSX.Element {
            </Col>
            <MoveTaskModal />
            <ModelRunnerDialog />
            <ImportDatasetModal />
        </Row>
    );
 }
--- a/cvat-ui/src/components/projects-page/actions-menu.tsx
+++ b/cvat-ui/src/components/projects-page/actions-menu.tsx
@ -2,13 +2,14 @@
 //
 // SPDX-License-Identifier: MIT
-import React from 'react';
+import React, { useCallback } from 'react';
 import { useDispatch } from 'react-redux';
 import Modal from 'antd/lib/modal';
 import Menu from 'antd/lib/menu';
 import { deleteProjectAsync } from 'actions/projects-actions';
 import { exportActions } from 'actions/export-actions';
 import { importActions } from 'actions/import-actions';
 interface Props {
    projectInstance: any;
@ -19,7 +20,7 @@ export default function ProjectActionsMenuComponent(props: Props): JSX.Element {
    const dispatch = useDispatch();
-    const onDeleteProject = (): void => {
+    const onDeleteProject = useCallback((): void => {
        Modal.confirm({
            title: `The project ${projectInstance.id} will be deleted`,
            content: 'All related data (images, annotations) will be lost. Continue?',
@ -33,21 +34,18 @@ export default function ProjectActionsMenuComponent(props: Props): JSX.Element {
            },
            okText: 'Delete',
        });
-    };
+    }, []);
    return (
-        <Menu className='cvat-project-actions-menu'>
+        <Menu selectable={false} className='cvat-project-actions-menu'>
-            <Menu.Item
+            <Menu.Item key='export-dataset' onClick={() => dispatch(exportActions.openExportModal(projectInstance))}>
-                key='project-export'
+                Export dataset
                onClick={() => dispatch(exportActions.openExportModal(projectInstance))}
            >
                Export project dataset
            </Menu.Item>
-            <hr />
+            <Menu.Item key='import-dataset' onClick={() => dispatch(importActions.openImportModal(projectInstance))}>
-            <Menu.Item
+                Import dataset
-                key='project-delete'
+            </Menu.Item>
-                onClick={onDeleteProject}
+            <Menu.Divider />
-            >
+            <Menu.Item key='delete' onClick={onDeleteProject}>
                Delete
            </Menu.Item>
        </Menu>
--- a/cvat-ui/src/components/projects-page/projects-page.tsx
+++ b/cvat-ui/src/components/projects-page/projects-page.tsx
@ -11,6 +11,7 @@ import Spin from 'antd/lib/spin';
 import { CombinedState, ProjectsQuery } from 'reducers/interfaces';
 import { getProjectsAsync } from 'actions/projects-actions';
 import FeedbackComponent from 'components/feedback/feedback';
 import ImportDatasetModal from 'components/import-dataset-modal/import-dataset-modal';
 import EmptyListComponent from './empty-list';
 import TopBarComponent from './top-bar';
 import ProjectListComponent from './project-list';
@ -55,6 +56,7 @@ export default function ProjectsPageComponent(): JSX.Element {
            <TopBarComponent />
            {projectsCount ? <ProjectListComponent /> : <EmptyListComponent notFound={anySearchQuery} />}
            <FeedbackComponent />
            <ImportDatasetModal />
        </div>
    );
 }
--- a/cvat-ui/src/reducers/import-reducer.ts
+++ b/cvat-ui/src/reducers/import-reducer.ts
@ -0,0 +1,61 @@
 // Copyright (C) 2021 Intel Corporation
 //
 // SPDX-License-Identifier: MIT
 import { ImportActions, ImportActionTypes } from 'actions/import-actions';
 import { ImportState } from './interfaces';
 const defaultState: ImportState = {
    progress: 0.0,
    status: '',
    instance: null,
    importingId: null,
    modalVisible: false,
 };
 export default (state: ImportState = defaultState, action: ImportActions): ImportState => {
    switch (action.type) {
        case ImportActionTypes.OPEN_IMPORT_MODAL:
            return {
                ...state,
                modalVisible: true,
                instance: action.payload.instance,
            };
        case ImportActionTypes.CLOSE_IMPORT_MODAL: {
            return {
                ...state,
                modalVisible: false,
                instance: null,
            };
        }
        case ImportActionTypes.IMPORT_DATASET: {
            const { id } = action.payload;
            return {
                ...state,
                importingId: id,
                status: 'The file is being uploaded to the server',
            };
        }
        case ImportActionTypes.IMPORT_DATASET_UPDATE_STATUS: {
            const { progress, status } = action.payload;
            return {
                ...state,
                progress,
                status,
            };
        }
        case ImportActionTypes.IMPORT_DATASET_FAILED:
        case ImportActionTypes.IMPORT_DATASET_SUCCESS: {
            return {
                ...state,
                progress: defaultState.progress,
                status: defaultState.status,
                importingId: null,
            };
        }
        default:
            return state;
    }
 };
--- a/cvat-ui/src/reducers/interfaces.ts
+++ b/cvat-ui/src/reducers/interfaces.ts
@ -117,6 +117,14 @@ export interface ExportState {
    modalVisible: boolean;
 }
 export interface ImportState {
    importingId: number | null;
    progress: number;
    status: string;
    instance: any;
    modalVisible: boolean;
 }
 export interface FormatsState {
    annotationFormats: any;
    fetching: boolean;
@ -396,6 +404,14 @@ export interface NotificationsState {
        predictor: {
            prediction: null | ErrorState;
        };
        exporting: {
            dataset: null | ErrorState;
            annotation: null | ErrorState;
        };
        importing: {
            dataset: null | ErrorState;
            annotation: null | ErrorState;
        };
        cloudStorages: {
            creating: null | ErrorState;
            fetching: null | ErrorState;
@ -705,6 +721,7 @@ export interface CombinedState {
    shortcuts: ShortcutsState;
    review: ReviewState;
    export: ExportState;
    import: ImportState;
    cloudStorages: CloudStoragesState;
 }
--- a/cvat-ui/src/reducers/notifications-reducer.ts
+++ b/cvat-ui/src/reducers/notifications-reducer.ts
@ -17,6 +17,7 @@ import { BoundariesActionTypes } from 'actions/boundaries-actions';
 import { UserAgreementsActionTypes } from 'actions/useragreements-actions';
 import { ReviewActionTypes } from 'actions/review-actions';
 import { ExportActionTypes } from 'actions/export-actions';
 import { ImportActionTypes } from 'actions/import-actions';
 import { CloudStorageActionTypes } from 'actions/cloud-storage-actions';
 import getCore from 'cvat-core-wrapper';
@ -115,6 +116,14 @@ const defaultState: NotificationsState = {
        predictor: {
            prediction: null,
        },
        exporting: {
            dataset: null,
            annotation: null,
        },
        importing: {
            dataset: null,
            annotation: null,
        },
        cloudStorages: {
            creating: null,
            fetching: null,
@ -327,9 +336,9 @@ export default function (state = defaultState, action: AnyAction): Notifications
                ...state,
                errors: {
                    ...state.errors,
-                    tasks: {
+                    exporting: {
-                        ...state.errors.tasks,
+                        ...state.errors.exporting,
-                        exportingAsDataset: {
+                        dataset: {
                            message:
                                'Could not export dataset for the ' +
                                `<a href="/${instanceType}s/${instanceID}" target="_blank">` +
@ -340,6 +349,25 @@ export default function (state = defaultState, action: AnyAction): Notifications
                },
            };
        }
        case ImportActionTypes.IMPORT_DATASET_FAILED: {
            const instanceID = action.payload.instance.id;
            return {
                ...state,
                errors: {
                    ...state.errors,
                    exporting: {
                        ...state.errors.exporting,
                        dataset: {
                            message:
                                'Could not import dataset to the ' +
                                `<a href="/projects/${instanceID}" target="_blank">` +
                                `project ${instanceID}</a>`,
                            reason: action.payload.error.toString(),
                        },
                    },
                },
            };
        }
        case TasksActionTypes.GET_TASKS_FAILED: {
            return {
                ...state,
--- a/cvat-ui/src/reducers/root-reducer.ts
+++ b/cvat-ui/src/reducers/root-reducer.ts
@ -18,6 +18,7 @@ import shortcutsReducer from './shortcuts-reducer';
 import userAgreementsReducer from './useragreements-reducer';
 import reviewReducer from './review-reducer';
 import exportReducer from './export-reducer';
 import importReducer from './import-reducer';
 import cloudStoragesReducer from './cloud-storages-reducer';
 export default function createRootReducer(): Reducer {
@ -37,6 +38,7 @@ export default function createRootReducer(): Reducer {
        userAgreements: userAgreementsReducer,
        review: reviewReducer,
        export: exportReducer,
        import: importReducer,
        cloudStorages: cloudStoragesReducer,
    });
 }
--- a/cvat/apps/dataset_manager/bindings.py
+++ b/cvat/apps/dataset_manager/bindings.py
@ -3,27 +3,33 @@
 #
 # SPDX-License-Identifier: MIT
 import os.path as osp
 import sys
 import rq
 import os.path as osp
 from attr import attrib, attrs
 from collections import namedtuple
 from pathlib import Path
 from typing import (Any, Callable, DefaultDict, Dict, List, Literal, Mapping,
-    NamedTuple, OrderedDict, Tuple, Union)
+    NamedTuple, OrderedDict, Tuple, Union, Set)
 import datumaro.components.annotation as datum_annotation
 import datumaro.components.extractor as datum_extractor
 from datumaro.components.dataset import Dataset
 from datumaro.util import cast
 from datumaro.util.image import ByteImage, Image
 from django.utils import timezone
 from cvat.apps.engine.frame_provider import FrameProvider
-from cvat.apps.engine.models import AttributeType, DimensionType
+from cvat.apps.engine.models import AttributeType, DimensionType, AttributeSpec
 from cvat.apps.engine.models import Image as Img
 from cvat.apps.engine.models import Label, Project, ShapeType, Task
 from cvat.apps.dataset_manager.formats.utils import get_label_color
 from .annotation import AnnotationIR, AnnotationManager, TrackManager
 CVAT_INTERNAL_ATTRIBUTES = {'occluded', 'outside', 'keyframe', 'track_id', 'rotation'}
 class InstanceLabelData:
    Attribute = NamedTuple('Attribute', [('name', str), ('value', Any)])
@ -32,6 +38,8 @@ class InstanceLabelData:
        db_labels = instance.label_set.all().prefetch_related('attributespec_set').order_by('pk')
        # If this flag is set to true, create attribute within anntations import
        self._soft_attribute_import = False
        self._label_mapping = OrderedDict[int, Label](
            ((db_label.id, db_label) for db_label in db_labels),
        )
@ -86,7 +94,7 @@ class InstanceLabelData:
    def _get_immutable_attribute_id(self, label_id, attribute_name):
        return self._get_attribute_id(label_id, attribute_name, 'immutable')
-    def _import_attribute(self, label_id, attribute):
+    def _import_attribute(self, label_id, attribute, mutable=False):
        spec_id = self._get_attribute_id(label_id, attribute.name)
        value = attribute.value
@ -108,6 +116,39 @@ class InstanceLabelData:
                raise Exception("Failed to convert attribute '%s'='%s': %s" %
                    (self._get_label_name(label_id), value, e))
        elif self._soft_attribute_import:
            if isinstance(value, (int, float)):
                attr_type = AttributeType.NUMBER
            elif isinstance(value, bool):
                attr_type = AttributeType.CHECKBOX
            else:
                value = str(value)
                if value.lower() in {'true', 'false'}:
                    value = value.lower() == 'true'
                    attr_type = AttributeType.CHECKBOX
                else:
                    attr_type = AttributeType.TEXT
            attr_spec = AttributeSpec(
                label_id=label_id,
                name=attribute.name,
                input_type=attr_type,
                mutable=mutable,
            )
            attr_spec.save()
            spec_id = attr_spec.id
            if label_id not in self._label_mapping:
                self._label_mapping[label_id] = Label.objects.get(id=label_id)
            if label_id not in self._attribute_mapping:
                self._attribute_mapping[label_id] = {'mutable': {}, 'immutable': {}, 'spec': {}}
            self._attribute_mapping[label_id]['immutable'][spec_id] = attribute.name
            self._attribute_mapping[label_id]['spec'][spec_id] = attr_spec
            self._attribute_mapping_merged[label_id] = {
                **self._attribute_mapping[label_id]['mutable'],
                **self._attribute_mapping[label_id]['immutable'],
            }
        return { 'spec_id': spec_id, 'value': value }
    def _export_attributes(self, attributes):
@ -397,6 +438,14 @@ class TaskData(InstanceLabelData):
    def meta(self):
        return self._meta
    @property
    def soft_attribute_import(self):
        return self._soft_attribute_import
    @soft_attribute_import.setter
    def soft_attribute_import(self, value: bool):
        self._soft_attribute_import = value
    def _import_tag(self, tag):
        _tag = tag._asdict()
        label_id = self._get_label_id(_tag.pop('label'))
@ -404,7 +453,10 @@ class TaskData(InstanceLabelData):
        _tag['label_id'] = label_id
        _tag['attributes'] = [self._import_attribute(label_id, attrib)
            for attrib in _tag['attributes']
-            if self._get_attribute_id(label_id, attrib.name)]
+            if self._get_attribute_id(label_id, attrib.name) or (
                self.soft_attribute_import and attrib.name not in CVAT_INTERNAL_ATTRIBUTES
            )
        ]
        return _tag
    def _import_shape(self, shape):
@ -414,7 +466,10 @@ class TaskData(InstanceLabelData):
        _shape['label_id'] = label_id
        _shape['attributes'] = [self._import_attribute(label_id, attrib)
            for attrib in _shape['attributes']
-            if self._get_attribute_id(label_id, attrib.name)]
+            if self._get_attribute_id(label_id, attrib.name) or (
                self.soft_attribute_import and attrib.name not in CVAT_INTERNAL_ATTRIBUTES
            )
        ]
        _shape['points'] = list(map(float, _shape['points']))
        return _shape
@ -430,10 +485,16 @@ class TaskData(InstanceLabelData):
            shape['frame'] = self.rel_frame_id(int(shape['frame']))
            _track['attributes'] = [self._import_attribute(label_id, attrib)
                for attrib in shape['attributes']
-                if self._get_immutable_attribute_id(label_id, attrib.name)]
+                if self._get_immutable_attribute_id(label_id, attrib.name) or (
-            shape['attributes'] = [self._import_attribute(label_id, attrib)
+                    self.soft_attribute_import and attrib.name not in CVAT_INTERNAL_ATTRIBUTES
                )
            ]
            shape['attributes'] = [self._import_attribute(label_id, attrib, mutable=True)
                for attrib in shape['attributes']
-                if self._get_mutable_attribute_id(label_id, attrib.name)]
+                if self._get_mutable_attribute_id(label_id, attrib.name) or (
                    self.soft_attribute_import and attrib.name not in CVAT_INTERNAL_ATTRIBUTES
                )
            ]
            shape['points'] = list(map(float, shape['points']))
        return _track
@ -510,40 +571,86 @@ class TaskData(InstanceLabelData):
        return None
 class ProjectData(InstanceLabelData):
-    LabeledShape = NamedTuple('LabledShape', [('type', str), ('frame', int), ('label', str), ('points', List[float]), ('occluded', bool), ('attributes', List[InstanceLabelData.Attribute]), ('source', str), ('group', int), ('rotation', float), ('z_order', int), ('task_id', int)])
+    @attrs
-    LabeledShape.__new__.__defaults__ = (0, 0, 0)
+    class LabeledShape:
-    TrackedShape = NamedTuple('TrackedShape',
+        type: str = attrib()
-        [('type', str), ('frame', int), ('points', List[float]), ('occluded', bool), ('outside', bool), ('keyframe', bool), ('attributes', List[InstanceLabelData.Attribute]), ('rotation', float), ('source', str), ('group', int), ('z_order', int), ('label', str), ('track_id', int)],
+        frame: int = attrib()
-    )
+        label: str = attrib()
-    TrackedShape.__new__.__defaults__ = (0, 'manual', 0, 0, None, 0)
+        points: List[float] = attrib()
-    Track = NamedTuple('Track', [('label', str), ('group', int), ('source', str), ('shapes', List[TrackedShape]), ('task_id', int)])
+        occluded: bool = attrib()
-    Tag = NamedTuple('Tag', [('frame', int), ('label', str), ('attributes', List[InstanceLabelData.Attribute]), ('source', str), ('group', int), ('task_id', int)])
+        attributes: List[InstanceLabelData.Attribute] = attrib()
-    Tag.__new__.__defaults__ = (0, )
+        source: str = attrib(default='manual')
-    Frame = NamedTuple('Frame', [('task_id', int), ('subset', str), ('idx', int), ('id', int), ('frame', int), ('name', str), ('width', int), ('height', int), ('labeled_shapes', List[Union[LabeledShape, TrackedShape]]), ('tags', List[Tag])])
+        group: int = attrib(default=0)
-
+        rotation: int = attrib(default=0)
-    def __init__(self, annotation_irs: Mapping[str, AnnotationIR], db_project: Project, host: str, create_callback: Callable = None):
+        z_order: int = attrib(default=0)
        task_id: int = attrib(default=None)
        subset: str = attrib(default=None)
    @attrs
    class TrackedShape:
        type: str = attrib()
        frame: int = attrib()
        points: List[float] = attrib()
        occluded: bool = attrib()
        outside: bool = attrib()
        keyframe: bool = attrib()
        attributes: List[InstanceLabelData.Attribute] = attrib()
        rotation: int = attrib(default=0)
        source: str = attrib(default='manual')
        group: int = attrib(default=0)
        z_order: int = attrib(default=0)
        label: str = attrib(default=None)
        track_id: int = attrib(default=0)
    @attrs
    class Track:
        label: str = attrib()
        shapes: List['ProjectData.TrackedShape'] = attrib()
        source: str = attrib(default='manual')
        group: int = attrib(default=0)
        task_id: int = attrib(default=None)
        subset: str = attrib(default=None)
    @attrs
    class Tag:
        frame: int = attrib()
        label: str = attrib()
        attributes: List[InstanceLabelData.Attribute] = attrib()
        source: str = attrib(default='manual')
        group: int = attrib(default=0)
        task_id: int = attrib(default=None)
        subset: str = attrib(default=None)
    @attrs
    class Frame:
        idx: int = attrib()
        id: int = attrib()
        frame: int = attrib()
        name: str = attrib()
        width: int = attrib()
        height: int = attrib()
        labeled_shapes: List[Union['ProjectData.LabeledShape', 'ProjectData.TrackedShape']] = attrib()
        tags: List['ProjectData.Tag'] = attrib()
        task_id: int = attrib(default=None)
        subset: str = attrib(default=None)
    def __init__(self, annotation_irs: Mapping[str, AnnotationIR], db_project: Project, host: str = '', task_annotations: Mapping[int, Any] = None, project_annotation=None):
        self._annotation_irs = annotation_irs
        self._db_project = db_project
-        self._db_tasks: OrderedDict[int, Task] = OrderedDict(
+        self._task_annotations = task_annotations
            ((db_task.id, db_task) for db_task in db_project.tasks.order_by("subset","id").all())
        )
        self._subsets = set()
        self._host = host
-        self._create_callback = create_callback
+        self._soft_attribute_import = False
-        self._MAX_ANNO_SIZE = 30000
+        self._project_annotation = project_annotation
        self._tasks_data: Dict[int, TaskData] = {}
        self._frame_info: Dict[Tuple[int, int], Literal["path", "width", "height", "subset"]] = dict()
-        self._frame_mapping: Dict[Tuple[str, str], Tuple[str, str]] = dict()
+        # (subset, path): (task id, frame number)
-        self._frame_steps: Dict[int, int] = {task.id: task.data.get_frame_step() for task in self._db_tasks.values()}
+        self._frame_mapping: Dict[Tuple[str, str], Tuple[int, int]] = dict()
-
+        self._frame_steps: Dict[int, int] = {}
-        for task in self._db_tasks.values():
+        self.new_tasks: Set[int] = set()
            self._subsets.add(task.subset)
        self._subsets: List[str] = list(self._subsets)
        InstanceLabelData.__init__(self, db_project)
        self.init()
        self._init_task_frame_offsets()
        self._init_frame_info()
        self._init_meta()
    def abs_frame_id(self, task_id: int, relative_id: int) -> int:
        task = self._db_tasks[task_id]
@ -559,6 +666,24 @@ class ProjectData(InstanceLabelData):
            raise ValueError(f"Unknown frame {absolute_id}")
        return d
    def init(self):
        self._init_tasks()
        self._init_task_frame_offsets()
        self._init_frame_info()
        self._init_meta()
    def _init_tasks(self):
        self._db_tasks: OrderedDict[int, Task] = OrderedDict(
            ((db_task.id, db_task) for db_task in self._db_project.tasks.order_by("subset","id").all())
        )
        subsets = set()
        for task in self._db_tasks.values():
            subsets.add(task.subset)
        self._subsets: List[str] = list(subsets)
        self._frame_steps: Dict[int, int] = {task.id: task.data.get_frame_step() for task in self._db_tasks.values()}
    def _init_task_frame_offsets(self):
        self._task_frame_offsets: Dict[int, int] = dict()
        s = 0
@ -627,6 +752,8 @@ class ProjectData(InstanceLabelData):
                    ])) for db_label in self._label_mapping.values()
                ]),
                ("subsets", '\n'.join([s if s else datum_extractor.DEFAULT_SUBSET_NAME for s in self._subsets])),
                ("owner", OrderedDict([
                    ("username", self._db_project.owner.username),
                    ("email", self._db_project.owner.email),
@ -789,15 +916,72 @@ class ProjectData(InstanceLabelData):
    def tasks(self):
        return list(self._db_tasks.values())
    @property
    def soft_attribute_import(self):
        return self._soft_attribute_import
    @soft_attribute_import.setter
    def soft_attribute_import(self, value: bool):
        self._soft_attribute_import =  value
        for task_data in self._tasks_data.values():
            task_data.soft_attribute_import = value
    @property
    def task_data(self):
        for task_id, task in self._db_tasks.items():
-            yield TaskData(self._annotation_irs[task_id], task, self._host)
+            if task_id in self._tasks_data:
                yield self._tasks_data[task_id]
            else:
                task_data = TaskData(
                    annotation_ir=self._annotation_irs[task_id],
                    db_task=task,
                    host=self._host,
                    create_callback=self._task_annotations[task_id].create \
                        if self._task_annotations is not None else None,
                )
                task_data._MAX_ANNO_SIZE //= len(self._db_tasks)
                task_data.soft_attribute_import = self.soft_attribute_import
                self._tasks_data[task_id] = task_data
                yield task_data
    @staticmethod
    def _get_filename(path):
        return osp.splitext(path)[0]
    def match_frame(self, path: str, subset: str=datum_extractor.DEFAULT_SUBSET_NAME, root_hint: str=None, path_has_ext: bool=True):
        if path_has_ext:
            path = self._get_filename(path)
        match_task, match_frame = self._frame_mapping.get((subset, path), (None, None))
        if not match_frame and root_hint and not path.startswith(root_hint):
            path = osp.join(root_hint, path)
            match_task, match_frame = self._frame_mapping.get((subset, path), (None, None))
        return match_task, match_frame
    def match_frame_fuzzy(self, path):
        path = Path(self._get_filename(path)).parts
        for (_subset, _path), (_tid, frame_number) in self._frame_mapping.items():
            if Path(_path).parts[-len(path):] == path :
                return frame_number
        return None
    def split_dataset(self, dataset: Dataset):
        for task_data in self.task_data:
            if task_data._db_task.id not in self.new_tasks:
                continue
            subset_dataset: Dataset = dataset.subsets()[task_data.db_task.subset].as_dataset()
            yield subset_dataset, task_data
    def add_labels(self, labels: List[dict]):
        attributes = []
        _labels = []
        for label in labels:
            _attributes = label.pop('attributes')
            _labels.append(Label(**label))
            attributes += [(label['name'], AttributeSpec(**at)) for at in _attributes]
        self._project_annotation.add_labels(_labels, attributes)
    def add_task(self, task, files):
        self._project_annotation.add_task(task, files, self)
 class CVATDataExtractorMixin:
    def __init__(self):
@ -1192,23 +1376,33 @@ def match_dm_item(item, task_data, root_hint=None):
            "'%s' with any task frame" % item.id)
    return frame_number
-def find_dataset_root(dm_dataset, task_data):
+def find_dataset_root(dm_dataset, instance_data: Union[TaskData, ProjectData]):
    longest_path = max(dm_dataset, key=lambda x: len(Path(x.id).parts),
        default=None)
    if longest_path is None:
        return None
    longest_path = longest_path.id
-    longest_match = task_data.match_frame_fuzzy(longest_path)
+    longest_match = instance_data.match_frame_fuzzy(longest_path)
    if longest_match is None:
        return None
-    longest_match = osp.dirname(task_data.frame_info[longest_match]['path'])
+    longest_match = osp.dirname(instance_data.frame_info[longest_match]['path'])
    prefix = longest_match[:-len(osp.dirname(longest_path)) or None]
    if prefix.endswith('/'):
        prefix = prefix[:-1]
    return prefix
-def import_dm_annotations(dm_dataset, task_data):
+def import_dm_annotations(dm_dataset: Dataset, instance_data: Union[TaskData, ProjectData]):
    if len(dm_dataset) == 0:
        return
    if isinstance(instance_data, ProjectData):
        for sub_dataset, task_data in instance_data.split_dataset(dm_dataset):
            # FIXME: temporary workaround for cvat format, will be removed after migration importer to datumaro
            sub_dataset._format = dm_dataset.format
            import_dm_annotations(sub_dataset, task_data)
        return
    shapes = {
        datum_annotation.AnnotationType.bbox: ShapeType.RECTANGLE,
        datum_annotation.AnnotationType.polygon: ShapeType.POLYGON,
@ -1217,16 +1411,15 @@ def import_dm_annotations(dm_dataset, task_data):
        datum_annotation.AnnotationType.cuboid_3d: ShapeType.CUBOID
    }
    if len(dm_dataset) == 0:
        return
    label_cat = dm_dataset.categories()[datum_annotation.AnnotationType.label]
-    root_hint = find_dataset_root(dm_dataset, task_data)
+    root_hint = find_dataset_root(dm_dataset, instance_data)
    tracks = {}
    for item in dm_dataset:
-        frame_number = task_data.abs_frame_id(
+        frame_number = instance_data.abs_frame_id(
-            match_dm_item(item, task_data, root_hint=root_hint))
+            match_dm_item(item, instance_data, root_hint=root_hint))
        # do not store one-item groups
        group_map = {0: 0}
@ -1255,27 +1448,117 @@ def import_dm_annotations(dm_dataset, task_data):
                        except Exception as e:
                            ann.points = ann.points
                        ann.z_order = 0
-                    task_data.add_shape(task_data.LabeledShape(
+
-                        type=shapes[ann.type],
+                    track_id = ann.attributes.pop('track_id', None)
-                        frame=frame_number,
+                    if track_id is None or dm_dataset.format != 'cvat' :
-                        points = ann.points,
+                        instance_data.add_shape(instance_data.LabeledShape(
-                        label=label_cat.items[ann.label].name,
+                            type=shapes[ann.type],
-                        occluded=ann.attributes.get('occluded') == True,
+                            frame=frame_number,
-                        z_order=ann.z_order,
+                            points=ann.points,
-                        group=group_map.get(ann.group, 0),
+                            label=label_cat.items[ann.label].name,
-                        source='manual',
+                            occluded=ann.attributes.pop('occluded', None) == True,
-                        attributes=[task_data.Attribute(name=n, value=str(v))
+                            z_order=ann.z_order,
-                            for n, v in ann.attributes.items()],
+                            group=group_map.get(ann.group, 0),
-                    ))
+                            source=str(ann.attributes.pop('source')).lower() \
                                if str(ann.attributes.get('source', None)).lower() in {'auto', 'manual'} else 'manual',
                            attributes=[instance_data.Attribute(name=n, value=str(v))
                                for n, v in ann.attributes.items()],
                        ))
                        continue
                    if ann.attributes.get('keyframe', None) == True or ann.attributes.get('outside', None) == True:
                        track = instance_data.TrackedShape(
                            type=shapes[ann.type],
                            frame=frame_number,
                            occluded=ann.attributes.pop('occluded', None) == True,
                            outside=ann.attributes.pop('outside', None) == True,
                            keyframe=ann.attributes.get('keyframe', None) == True,
                            points=ann.points,
                            z_order=ann.z_order,
                            source=str(ann.attributes.pop('source')).lower() \
                                if str(ann.attributes.get('source', None)).lower() in {'auto', 'manual'} else 'manual',
                            attributes=[instance_data.Attribute(name=n, value=str(v))
                                for n, v in ann.attributes.items()],
                        )
                        if track_id not in tracks:
                            tracks[track_id] = instance_data.Track(
                                label=label_cat.items[ann.label].name,
                                group=group_map.get(ann.group, 0),
                                source=str(ann.attributes.pop('source')).lower() \
                                    if str(ann.attributes.get('source', None)).lower() in {'auto', 'manual'} else 'manual',
                                shapes=[],
                            )
                        tracks[track_id].shapes.append(track)
                elif ann.type == datum_annotation.AnnotationType.label:
-                    task_data.add_tag(task_data.Tag(
+                    instance_data.add_tag(instance_data.Tag(
                        frame=frame_number,
                        label=label_cat.items[ann.label].name,
                        group=group_map.get(ann.group, 0),
                        source='manual',
-                        attributes=[task_data.Attribute(name=n, value=str(v))
+                        attributes=[instance_data.Attribute(name=n, value=str(v))
                            for n, v in ann.attributes.items()],
                    ))
            except Exception as e:
                raise CvatImportError("Image {}: can't import annotation "
-                    "#{} ({}): {}".format(item.id, idx, ann.type.name, e))
+                    "#{} ({}): {}".format(item.id, idx, ann.type.name, e)) from e
    for track in tracks.values():
        instance_data.add_track(track)
 def import_labels_to_project(project_annotation, dataset: Dataset):
    labels = []
    label_colors = []
    for label in dataset.categories()[datum_annotation.AnnotationType.label].items:
        db_label = Label(
            name=label.name,
            color=get_label_color(label.name, label_colors)
        )
        labels.append(db_label)
        label_colors.append(db_label.color)
    project_annotation.add_labels(labels)
 def load_dataset_data(project_annotation, dataset: Dataset, project_data):
    if not project_annotation.db_project.label_set.count():
        import_labels_to_project(project_annotation, dataset)
    else:
        for label in dataset.categories()[datum_annotation.AnnotationType.label].items:
            if not project_annotation.db_project.label_set.filter(name=label.name).exists():
                raise CvatImportError(f'Target project does not have label with name "{label.name}"')
    for subset_id, subset in enumerate(dataset.subsets().values()):
        job = rq.get_current_job()
        job.meta['status'] = 'Task from dataset is being created...'
        job.meta['progress'] = (subset_id + job.meta.get('task_progress', 0.)) / len(dataset.subsets().keys())
        job.save_meta()
        task_fields = {
            'project': project_annotation.db_project,
            'name': subset.name,
            'owner': project_annotation.db_project.owner,
            'subset': subset.name,
        }
        subset_dataset = subset.as_dataset()
        dataset_files = {
            'media': [],
            'data_root': dataset.data_path + osp.sep,
        }
        for dataset_item in subset_dataset:
            if dataset_item.image and dataset_item.image.has_data:
                dataset_files['media'].append(dataset_item.image.path)
            elif dataset_item.point_cloud:
                dataset_files['media'].append(dataset_item.point_cloud)
            if isinstance(dataset_item.related_images, list):
                dataset_files['media'] += \
                    list(map(lambda ri: ri.path, dataset_item.related_images))
        shortes_path = min(dataset_files['media'], key=lambda x: len(Path(x).parts), default=None)
        if shortes_path is not None:
            dataset_files['data_root'] = str(Path(shortes_path).parent.absolute()) + osp.sep
        project_annotation.add_task(task_fields, dataset_files, project_data)
--- a/cvat/apps/dataset_manager/formats/camvid.py
+++ b/cvat/apps/dataset_manager/formats/camvid.py
@ -33,10 +33,12 @@ def _export(dst_file, instance_data, save_images=False):
        make_zip_archive(temp_dir, dst_file)
@importer(name='CamVid', ext='ZIP', version='1.0')
-def _import(src_file, instance_data):
+def _import(src_file, instance_data, load_data_callback=None):
    with TemporaryDirectory() as tmp_dir:
        Archive(src_file.name).extractall(tmp_dir)
        dataset = Dataset.import_from(tmp_dir, 'camvid', env=dm_env)
        dataset.transform('masks_to_polygons')
        if load_data_callback is not None:
            load_data_callback(dataset, instance_data)
        import_dm_annotations(dataset, instance_data)
--- a/cvat/apps/dataset_manager/formats/cityscapes.py
+++ b/cvat/apps/dataset_manager/formats/cityscapes.py
@ -34,7 +34,7 @@ def _export(dst_file, instance_data, save_images=False):
        make_zip_archive(temp_dir, dst_file)
@importer(name='Cityscapes', ext='ZIP', version='1.0')
-def _import(src_file, instance_data):
+def _import(src_file, instance_data, load_data_callback=None):
    with TemporaryDirectory() as tmp_dir:
        Archive(src_file.name).extractall(tmp_dir)
@ -46,4 +46,6 @@ def _import(src_file, instance_data):
        dataset = Dataset.import_from(tmp_dir, 'cityscapes', env=dm_env)
        dataset.transform('masks_to_polygons')
        if load_data_callback is not None:
            load_data_callback(dataset, instance_data)
        import_dm_annotations(dataset, instance_data)
--- a/cvat/apps/dataset_manager/formats/coco.py
+++ b/cvat/apps/dataset_manager/formats/coco.py
@ -13,7 +13,6 @@ from cvat.apps.dataset_manager.util import make_zip_archive
 from .registry import dm_env, exporter, importer
@exporter(name='COCO', ext='ZIP', version='1.0')
 def _export(dst_file, instance_data, save_images=False):
    dataset = Dataset.from_extractors(GetCVATDataExtractor(
@ -25,12 +24,15 @@ def _export(dst_file, instance_data, save_images=False):
        make_zip_archive(temp_dir, dst_file)
@importer(name='COCO', ext='JSON, ZIP', version='1.0')
-def _import(src_file, instance_data):
+def _import(src_file, instance_data, load_data_callback=None):
    if zipfile.is_zipfile(src_file):
        with TemporaryDirectory() as tmp_dir:
            zipfile.ZipFile(src_file).extractall(tmp_dir)
            dataset = Dataset.import_from(tmp_dir, 'coco', env=dm_env)
            if load_data_callback is not None:
                load_data_callback(dataset, instance_data)
            import_dm_annotations(dataset, instance_data)
    else:
        dataset = Dataset.import_from(src_file.name,
--- a/cvat/apps/dataset_manager/formats/cvat.py
+++ b/cvat/apps/dataset_manager/formats/cvat.py
@ -5,19 +5,418 @@
 from io import BufferedWriter
 import os
 import os.path as osp
 from glob import glob
 from typing import Callable
 import zipfile
 from collections import OrderedDict
 from glob import glob
 from tempfile import TemporaryDirectory
 from defusedxml import ElementTree
 from datumaro.components.dataset import Dataset, DatasetItem
 from datumaro.components.extractor import Importer, Extractor, DEFAULT_SUBSET_NAME
 from datumaro.components.annotation import (
    AnnotationType, Bbox, Points, Polygon, PolyLine, Label, LabelCategories,
 )
-from datumaro.components.extractor import DatasetItem
+from datumaro.util.image import Image
-from cvat.apps.dataset_manager.bindings import TaskData, match_dm_item, ProjectData, get_defaulted_subset
+from cvat.apps.dataset_manager.bindings import TaskData, match_dm_item, ProjectData, get_defaulted_subset, import_dm_annotations
 from cvat.apps.dataset_manager.util import make_zip_archive
 from cvat.apps.engine.frame_provider import FrameProvider
-from .registry import exporter, importer
+from .registry import exporter, importer, dm_env
 class CvatPath:
    IMAGES_DIR = 'images'
    MEDIA_EXTS = ('.jpg', '.jpeg', '.png')
    BUILTIN_ATTRS = {'occluded', 'outside', 'keyframe', 'track_id'}
 class CvatExtractor(Extractor):
    _SUPPORTED_SHAPES = ('box', 'polygon', 'polyline', 'points')
    def __init__(self, path, subsets=None):
        assert osp.isfile(path), path
        rootpath = osp.dirname(path)
        images_dir = ''
        if osp.isdir(osp.join(rootpath, CvatPath.IMAGES_DIR)):
            images_dir = osp.join(rootpath, CvatPath.IMAGES_DIR)
        self._images_dir = images_dir
        self._path = path
        if not subsets:
            subsets = self._get_subsets_from_anno(path)
        self._subsets = subsets
        super().__init__(subsets=self._subsets)
        image_items = self._parse_images(images_dir, self._subsets)
        items, categories = self._parse(path)
        self._items = list(self._load_items(items, image_items).values())
        self._categories = categories
    def categories(self):
        return self._categories
    def __iter__(self):
        yield from self._items
    def __len__(self):
        return len(self._items)
    def get(self, _id, subset=DEFAULT_SUBSET_NAME):
        assert subset in self._subsets, '{} not in {}'.format(subset, ', '.join(self._subsets))
        return super().get(_id, subset)
    @staticmethod
    def _get_subsets_from_anno(path):
        context = ElementTree.iterparse(path, events=("start", "end"))
        context = iter(context)
        for ev, el in context:
            if ev == 'start':
                if el.tag == 'subsets':
                    if el.text is not None:
                        subsets = el.text.split('\n')
                        return subsets
            if ev == 'end':
                if el.tag == 'meta':
                    return [DEFAULT_SUBSET_NAME]
                el.clear()
        return [DEFAULT_SUBSET_NAME]
    @staticmethod
    def _parse_images(image_dir, subsets):
        items = OrderedDict()
        def parse_image_dir(image_dir, subset):
            for file in sorted(glob(image_dir), key=osp.basename):
                name, ext = osp.splitext(osp.basename(file))
                if ext.lower() in CvatPath.MEDIA_EXTS:
                    items[(subset, name)] = DatasetItem(id=name, annotations=[],
                        image=Image(path=file), subset=subset or DEFAULT_SUBSET_NAME,
                    )
        if subsets == [DEFAULT_SUBSET_NAME] and not osp.isdir(osp.join(image_dir, DEFAULT_SUBSET_NAME)):
            parse_image_dir(osp.join(image_dir, '*.*'), None)
        else:
            for subset in subsets:
                parse_image_dir(osp.join(image_dir, subset, '*.*'), subset)
        return items
    @classmethod
    def _parse(cls, path):
        context = ElementTree.iterparse(path, events=("start", "end"))
        context = iter(context)
        categories, tasks_info, attribute_types = cls._parse_meta(context)
        items = OrderedDict()
        track = None
        shape = None
        tag = None
        attributes = None
        image = None
        subset = None
        for ev, el in context:
            if ev == 'start':
                if el.tag == 'track':
                    frame_size = tasks_info[int(el.attrib.get('task_id'))]['frame_size'] if el.attrib.get('task_id') else tuple(tasks_info.values())[0]['frame_size']
                    track = {
                        'id': el.attrib['id'],
                        'label': el.attrib.get('label'),
                        'group': int(el.attrib.get('group_id', 0)),
                        'height': frame_size[0],
                        'width': frame_size[1],
                    }
                    subset = el.attrib.get('subset')
                elif el.tag == 'image':
                    image = {
                        'name': el.attrib.get('name'),
                        'frame': el.attrib['id'],
                        'width': el.attrib.get('width'),
                        'height': el.attrib.get('height'),
                    }
                    subset = el.attrib.get('subset')
                elif el.tag in cls._SUPPORTED_SHAPES and (track or image):
                    attributes = {}
                    shape = {
                        'type': None,
                        'attributes': attributes,
                    }
                    if track:
                        shape.update(track)
                        shape['track_id'] = int(track['id'])
                    if image:
                        shape.update(image)
                elif el.tag == 'tag' and image:
                    attributes = {}
                    tag = {
                        'frame': image['frame'],
                        'attributes': attributes,
                        'group': int(el.attrib.get('group_id', 0)),
                        'label': el.attrib['label'],
                    }
                    subset = el.attrib.get('subset')
            elif ev == 'end':
                if el.tag == 'attribute' and attributes is not None:
                    attr_value = el.text or ''
                    attr_type = attribute_types.get(el.attrib['name'])
                    if el.text in ['true', 'false']:
                        attr_value = attr_value == 'true'
                    elif attr_type is not None and attr_type != 'text':
                        try:
                            attr_value = float(attr_value)
                        except ValueError:
                            pass
                    attributes[el.attrib['name']] = attr_value
                elif el.tag in cls._SUPPORTED_SHAPES:
                    if track is not None:
                        shape['frame'] = el.attrib['frame']
                        shape['outside'] = (el.attrib.get('outside') == '1')
                        shape['keyframe'] = (el.attrib.get('keyframe') == '1')
                    if image is not None:
                        shape['label'] = el.attrib.get('label')
                        shape['group'] = int(el.attrib.get('group_id', 0))
                    shape['type'] = el.tag
                    shape['occluded'] = (el.attrib.get('occluded') == '1')
                    shape['z_order'] = int(el.attrib.get('z_order', 0))
                    if el.tag == 'box':
                        shape['points'] = list(map(float, [
                            el.attrib['xtl'], el.attrib['ytl'],
                            el.attrib['xbr'], el.attrib['ybr'],
                        ]))
                    else:
                        shape['points'] = []
                        for pair in el.attrib['points'].split(';'):
                            shape['points'].extend(map(float, pair.split(',')))
                    frame_desc = items.get((subset, shape['frame']), {'annotations': []})
                    frame_desc['annotations'].append(
                        cls._parse_shape_ann(shape, categories))
                    items[(subset, shape['frame'])] = frame_desc
                    shape = None
                elif el.tag == 'tag':
                    frame_desc = items.get((subset, tag['frame']), {'annotations': []})
                    frame_desc['annotations'].append(
                        cls._parse_tag_ann(tag, categories))
                    items[(subset, tag['frame'])] = frame_desc
                    tag = None
                elif el.tag == 'track':
                    track = None
                elif el.tag == 'image':
                    frame_desc = items.get((subset, image['frame']), {'annotations': []})
                    frame_desc.update({
                        'name': image.get('name'),
                        'height': image.get('height'),
                        'width': image.get('width'),
                        'subset': subset,
                    })
                    items[(subset, image['frame'])] = frame_desc
                    image = None
                el.clear()
        return items, categories
    @staticmethod
    def _parse_meta(context):
        ev, el = next(context)
        if not (ev == 'start' and el.tag == 'annotations'):
            raise Exception("Unexpected token ")
        categories = {}
        tasks_info = {}
        frame_size = [None, None]
        task_id = None
        mode = None
        labels = OrderedDict()
        label = None
        # Recursive descent parser
        el = None
        states = ['annotations']
        def accepted(expected_state, tag, next_state=None):
            state = states[-1]
            if state == expected_state and el is not None and el.tag == tag:
                if not next_state:
                    next_state = tag
                states.append(next_state)
                return True
            return False
        def consumed(expected_state, tag):
            state = states[-1]
            if state == expected_state and el is not None and el.tag == tag:
                states.pop()
                return True
            return False
        for ev, el in context:
            if ev == 'start':
                if accepted('annotations', 'meta'): pass
                elif accepted('meta', 'task'): pass
                elif accepted('meta', 'project'): pass
                elif accepted('project', 'tasks'): pass
                elif accepted('tasks', 'task'): pass
                elif accepted('task', 'id', next_state='task_id'): pass
                elif accepted('task', 'segment'): pass
                elif accepted('task', 'mode'): pass
                elif accepted('task', 'original_size'): pass
                elif accepted('original_size', 'height', next_state='frame_height'): pass
                elif accepted('original_size', 'width', next_state='frame_width'): pass
                elif accepted('task', 'labels'): pass
                elif accepted('project', 'labels'): pass
                elif accepted('labels', 'label'):
                    label = { 'name': None, 'attributes': [] }
                elif accepted('label', 'name', next_state='label_name'): pass
                elif accepted('label', 'attributes'): pass
                elif accepted('attributes', 'attribute'): pass
                elif accepted('attribute', 'name', next_state='attr_name'): pass
                elif accepted('attribute', 'input_type', next_state='attr_type'): pass
                elif accepted('annotations', 'image') or \
                     accepted('annotations', 'track') or \
                     accepted('annotations', 'tag'):
                    break
                else:
                    pass
            elif ev == 'end':
                if consumed('meta', 'meta'):
                    break
                elif consumed('project', 'project'): pass
                elif consumed('tasks', 'tasks'): pass
                elif consumed('task', 'task'):
                    tasks_info[task_id] = {
                        'frame_size': frame_size,
                        'mode': mode,
                    }
                    frame_size = [None, None]
                    mode = None
                elif consumed('task_id', 'id'):
                    task_id = int(el.text)
                elif consumed('segment', 'segment'): pass
                elif consumed('mode', 'mode'):
                    mode = el.text
                elif consumed('original_size', 'original_size'): pass
                elif consumed('frame_height', 'height'):
                    frame_size[0] = int(el.text)
                elif consumed('frame_width', 'width'):
                    frame_size[1] = int(el.text)
                elif consumed('label_name', 'name'):
                    label['name'] = el.text
                elif consumed('attr_name', 'name'):
                    label['attributes'].append({'name': el.text})
                elif consumed('attr_type', 'input_type'):
                    label['attributes'][-1]['input_type'] = el.text
                elif consumed('attribute', 'attribute'): pass
                elif consumed('attributes', 'attributes'): pass
                elif consumed('label', 'label'):
                    labels[label['name']] = label['attributes']
                    label = None
                elif consumed('labels', 'labels'): pass
                else:
                    pass
        assert len(states) == 1 and states[0] == 'annotations', \
            "Expected 'meta' section in the annotation file, path: %s" % states
        common_attrs = ['occluded']
        if 'interpolation' in map(lambda t: t['mode'], tasks_info.values()):
            common_attrs.append('keyframe')
            common_attrs.append('outside')
            common_attrs.append('track_id')
        label_cat = LabelCategories(attributes=common_attrs)
        attribute_types = {}
        for label, attrs in labels.items():
            attr_names = {v['name'] for v in attrs}
            label_cat.add(label, attributes=attr_names)
            for attr in attrs:
                attribute_types[attr['name']] = attr['input_type']
        categories[AnnotationType.label] = label_cat
        return categories, tasks_info, attribute_types
    @classmethod
    def _parse_shape_ann(cls, ann, categories):
        ann_id = ann.get('id', 0)
        ann_type = ann['type']
        attributes = ann.get('attributes') or {}
        if 'occluded' in categories[AnnotationType.label].attributes:
            attributes['occluded'] = ann.get('occluded', False)
        if 'outside' in ann:
            attributes['outside'] = ann['outside']
        if 'keyframe' in ann:
            attributes['keyframe'] = ann['keyframe']
        if 'track_id' in ann:
            attributes['track_id'] = ann['track_id']
        group = ann.get('group')
        label = ann.get('label')
        label_id = categories[AnnotationType.label].find(label)[0]
        z_order = ann.get('z_order', 0)
        points = ann.get('points', [])
        if ann_type == 'polyline':
            return PolyLine(points, label=label_id, z_order=z_order,
                id=ann_id, attributes=attributes, group=group)
        elif ann_type == 'polygon':
            return Polygon(points, label=label_id, z_order=z_order,
                id=ann_id, attributes=attributes, group=group)
        elif ann_type == 'points':
            return Points(points, label=label_id, z_order=z_order,
                id=ann_id, attributes=attributes, group=group)
        elif ann_type == 'box':
            x, y = points[0], points[1]
            w, h = points[2] - x, points[3] - y
            return Bbox(x, y, w, h, label=label_id, z_order=z_order,
                id=ann_id, attributes=attributes, group=group)
        else:
            raise NotImplementedError("Unknown annotation type '%s'" % ann_type)
    @classmethod
    def _parse_tag_ann(cls, ann, categories):
        label = ann.get('label')
        label_id = categories[AnnotationType.label].find(label)[0]
        group = ann.get('group')
        attributes = ann.get('attributes')
        return Label(label_id, attributes=attributes, group=group)
    def _load_items(self, parsed, image_items):
        for (subset, frame_id), item_desc in parsed.items():
            name = item_desc.get('name', 'frame_%06d.PNG' % int(frame_id))
            image = osp.join(self._images_dir, subset, name) if subset else osp.join(self._images_dir, name)
            image_size = (item_desc.get('height'), item_desc.get('width'))
            if all(image_size):
                image = Image(path=image, size=tuple(map(int, image_size)))
            di = image_items.get((subset, osp.splitext(name)[0]), DatasetItem(
                id=name, annotations=[],
            ))
            di.subset = subset or DEFAULT_SUBSET_NAME
            di.annotations = item_desc.get('annotations')
            di.attributes = {'frame': int(frame_id)}
            di.image = image if isinstance(image, Image) else di.image
            image_items[(subset, osp.splitext(name)[0])] = di
        return image_items
 dm_env.extractors.register('cvat', CvatExtractor)
 class CvatImporter(Importer):
    @classmethod
    def find_sources(cls, path):
        return cls._find_sources_recursive(path, '.xml', 'cvat')
 dm_env.importers.register('cvat', CvatImporter)
 def pairwise(iterable):
@ -457,13 +856,11 @@ def dump_as_cvat_interpolation(dumper, annotations):
    dumper.close_root()
-def load(file_object, annotations):
+def load_anno(file_object, annotations):
-    from defusedxml import ElementTree
+    supported_shapes = ('box', 'polygon', 'polyline', 'points', 'cuboid')
    context = ElementTree.iterparse(file_object, events=("start", "end"))
    context = iter(context)
-    ev, _ = next(context)
+    next(context)
    supported_shapes = ('box', 'polygon', 'polyline', 'points', 'cuboid')
    track = None
    shape = None
@ -641,15 +1038,21 @@ def _export_images(dst_file, instance_data, save_images=False):
            anno_callback=dump_as_cvat_annotation, save_images=save_images)
@importer(name='CVAT', ext='XML, ZIP', version='1.1')
-def _import(src_file, task_data):
+def _import(src_file, instance_data, load_data_callback=None):
    is_zip = zipfile.is_zipfile(src_file)
    src_file.seek(0)
    if is_zip:
        with TemporaryDirectory() as tmp_dir:
            zipfile.ZipFile(src_file).extractall(tmp_dir)
-            anno_paths = glob(osp.join(tmp_dir, '**', '*.xml'), recursive=True)
+            if isinstance(instance_data, ProjectData):
-            for p in anno_paths:
+                dataset = Dataset.import_from(tmp_dir, 'cvat', env=dm_env)
-                load(p, task_data)
+                if load_data_callback is not None:
                    load_data_callback(dataset, instance_data)
                import_dm_annotations(dataset, instance_data)
            else:
                anno_paths = glob(osp.join(tmp_dir, '**', '*.xml'), recursive=True)
                for p in anno_paths:
                    load_anno(p, instance_data)
    else:
-        load(src_file, task_data)
+        load_anno(src_file, instance_data)
--- a/cvat/apps/dataset_manager/formats/icdar.py
+++ b/cvat/apps/dataset_manager/formats/icdar.py
@ -86,11 +86,13 @@ def _export_recognition(dst_file, instance_data, save_images=False):
        make_zip_archive(temp_dir, dst_file)
@importer(name='ICDAR Recognition', ext='ZIP', version='1.0')
-def _import(src_file, instance_data):
+def _import(src_file, instance_data, load_data_callback=None):
    with TemporaryDirectory() as tmp_dir:
        zipfile.ZipFile(src_file).extractall(tmp_dir)
        dataset = Dataset.import_from(tmp_dir, 'icdar_word_recognition', env=dm_env)
        dataset.transform(CaptionToLabel, 'icdar')
        if load_data_callback is not None:
            load_data_callback(dataset, instance_data)
        import_dm_annotations(dataset, instance_data)
@ -103,12 +105,14 @@ def _export_localization(dst_file, instance_data, save_images=False):
        make_zip_archive(temp_dir, dst_file)
@importer(name='ICDAR Localization', ext='ZIP', version='1.0')
-def _import(src_file, instance_data):
+def _import(src_file, instance_data, load_data_callback=None):
    with TemporaryDirectory() as tmp_dir:
        zipfile.ZipFile(src_file).extractall(tmp_dir)
        dataset = Dataset.import_from(tmp_dir, 'icdar_text_localization', env=dm_env)
        dataset.transform(AddLabelToAnns, 'icdar')
        if load_data_callback is not None:
            load_data_callback(dataset, instance_data)
        import_dm_annotations(dataset, instance_data)
@ -125,10 +129,12 @@ def _export_segmentation(dst_file, instance_data, save_images=False):
        make_zip_archive(temp_dir, dst_file)
@importer(name='ICDAR Segmentation', ext='ZIP', version='1.0')
-def _import(src_file, instance_data):
+def _import(src_file, instance_data, load_data_callback=None):
    with TemporaryDirectory() as tmp_dir:
        zipfile.ZipFile(src_file).extractall(tmp_dir)
        dataset = Dataset.import_from(tmp_dir, 'icdar_text_segmentation', env=dm_env)
        dataset.transform(AddLabelToAnns, 'icdar')
        dataset.transform('masks_to_polygons')
        if load_data_callback is not None:
            load_data_callback(dataset, instance_data)
        import_dm_annotations(dataset, instance_data)
--- a/cvat/apps/dataset_manager/formats/imagenet.py
+++ b/cvat/apps/dataset_manager/formats/imagenet.py
@ -29,11 +29,13 @@ def _export(dst_file, instance_data, save_images=False):
        make_zip_archive(temp_dir, dst_file)
@importer(name='ImageNet', ext='ZIP', version='1.0')
-def _import(src_file, instance_data):
+def _import(src_file, instance_data, load_data_callback=None):
    with TemporaryDirectory() as tmp_dir:
        zipfile.ZipFile(src_file).extractall(tmp_dir)
        if glob(osp.join(tmp_dir, '*.txt')):
            dataset = Dataset.import_from(tmp_dir, 'imagenet_txt', env=dm_env)
        else:
            dataset = Dataset.import_from(tmp_dir, 'imagenet', env=dm_env)
            if load_data_callback is not None:
                load_data_callback(dataset, instance_data)
        import_dm_annotations(dataset, instance_data)
--- a/cvat/apps/dataset_manager/formats/labelme.py
+++ b/cvat/apps/dataset_manager/formats/labelme.py
@ -24,10 +24,12 @@ def _export(dst_file, instance_data, save_images=False):
        make_zip_archive(temp_dir, dst_file)
@importer(name='LabelMe', ext='ZIP', version='3.0')
-def _import(src_file, instance_data):
+def _import(src_file, instance_data, load_data_callback=None):
    with TemporaryDirectory() as tmp_dir:
        Archive(src_file.name).extractall(tmp_dir)
        dataset = Dataset.import_from(tmp_dir, 'label_me', env=dm_env)
        dataset.transform('masks_to_polygons')
        if load_data_callback is not None:
            load_data_callback(dataset, instance_data)
        import_dm_annotations(dataset, instance_data)
--- a/cvat/apps/dataset_manager/formats/lfw.py
+++ b/cvat/apps/dataset_manager/formats/lfw.py
@ -14,12 +14,13 @@ from .registry import dm_env, exporter, importer
@importer(name='LFW', ext='ZIP', version='1.0')
-def _import(src_file, instance_data):
+def _import(src_file, instance_data, load_data_callback=None):
    with TemporaryDirectory() as tmp_dir:
        Archive(src_file.name).extractall(tmp_dir)
        dataset = Dataset.import_from(tmp_dir, 'lfw')
-
+        if load_data_callback is not None:
            load_data_callback(dataset, instance_data)
        import_dm_annotations(dataset, instance_data)
@exporter(name='LFW', ext='ZIP', version='1.0')
--- a/cvat/apps/dataset_manager/formats/market1501.py
+++ b/cvat/apps/dataset_manager/formats/market1501.py
@ -70,10 +70,12 @@ def _export(dst_file, instance_data, save_images=False):
        make_zip_archive(temp_dir, dst_file)
@importer(name='Market-1501', ext='ZIP', version='1.0')
-def _import(src_file, instance_data):
+def _import(src_file, instance_data, load_data_callback=None):
    with TemporaryDirectory() as tmp_dir:
        zipfile.ZipFile(src_file).extractall(tmp_dir)
        dataset = Dataset.import_from(tmp_dir, 'market1501', env=dm_env)
        dataset.transform(AttrToLabelAttr, 'market-1501')
        if load_data_callback is not None:
            load_data_callback(dataset, instance_data)
        import_dm_annotations(dataset, instance_data)
--- a/cvat/apps/dataset_manager/formats/mask.py
+++ b/cvat/apps/dataset_manager/formats/mask.py
@ -30,10 +30,12 @@ def _export(dst_file, instance_data, save_images=False):
        make_zip_archive(temp_dir, dst_file)
@importer(name='Segmentation mask', ext='ZIP', version='1.1')
-def _import(src_file, instance_data):
+def _import(src_file, instance_data, load_data_callback=None):
    with TemporaryDirectory() as tmp_dir:
        Archive(src_file.name).extractall(tmp_dir)
        dataset = Dataset.import_from(tmp_dir, 'voc', env=dm_env)
        dataset.transform('masks_to_polygons')
        if load_data_callback is not None:
            load_data_callback(dataset, instance_data)
        import_dm_annotations(dataset, instance_data)
--- a/cvat/apps/dataset_manager/formats/mot.py
+++ b/cvat/apps/dataset_manager/formats/mot.py
@ -13,6 +13,78 @@ from cvat.apps.dataset_manager.util import make_zip_archive
 from .registry import dm_env, exporter, importer
 def _import_task(dataset, task_data):
    tracks = {}
    label_cat = dataset.categories()[datumaro.AnnotationType.label]
    for item in dataset:
        frame_number = int(item.id) - 1 # NOTE: MOT frames start from 1
        frame_number = task_data.abs_frame_id(frame_number)
        for ann in item.annotations:
            if ann.type != datumaro.AnnotationType.bbox:
                continue
            track_id = ann.attributes.get('track_id')
            if track_id is None:
                # Extension. Import regular boxes:
                task_data.add_shape(task_data.LabeledShape(
                    type='rectangle',
                    label=label_cat.items[ann.label].name,
                    points=ann.points,
                    occluded=ann.attributes.get('occluded') == True,
                    z_order=ann.z_order,
                    group=0,
                    frame=frame_number,
                    attributes=[],
                    source='manual',
                ))
                continue
            shape = task_data.TrackedShape(
                type='rectangle',
                points=ann.points,
                occluded=ann.attributes.get('occluded') == True,
                outside=False,
                keyframe=True,
                z_order=ann.z_order,
                frame=frame_number,
                attributes=[],
                source='manual',
            )
            # build trajectories as lists of shapes in track dict
            if track_id not in tracks:
                tracks[track_id] = task_data.Track(
                    label_cat.items[ann.label].name, 0, 'manual', [])
            tracks[track_id].shapes.append(shape)
    for track in tracks.values():
        # MOT annotations do not require frames to be ordered
        track.shapes.sort(key=lambda t: t.frame)
        # insert outside=True in skips between the frames track is visible
        prev_shape_idx = 0
        prev_shape = track.shapes[0]
        for shape in track.shapes[1:]:
            has_skip = task_data.frame_step < shape.frame - prev_shape.frame
            if has_skip and not prev_shape.outside:
                prev_shape = prev_shape._replace(outside=True,
                        frame=prev_shape.frame + task_data.frame_step)
                prev_shape_idx += 1
                track.shapes.insert(prev_shape_idx, prev_shape)
            prev_shape = shape
            prev_shape_idx += 1
        # Append a shape with outside=True to finish the track
        last_shape = track.shapes[-1]
        if last_shape.frame + task_data.frame_step <= \
                int(task_data.meta['task']['stop_frame']):
            track.shapes.append(last_shape._replace(outside=True,
                frame=last_shape.frame + task_data.frame_step)
            )
        task_data.add_track(track)
@exporter(name='MOT', ext='ZIP', version='1.1')
 def _export(dst_file, instance_data, save_images=False):
@ -24,79 +96,18 @@ def _export(dst_file, instance_data, save_images=False):
        make_zip_archive(temp_dir, dst_file)
@importer(name='MOT', ext='ZIP', version='1.1')
-def _import(src_file, task_data):
+def _import(src_file, instance_data, load_data_callback=None):
    with TemporaryDirectory() as tmp_dir:
        Archive(src_file.name).extractall(tmp_dir)
        dataset = Dataset.import_from(tmp_dir, 'mot_seq', env=dm_env)
        if load_data_callback is not None:
            load_data_callback(dataset, instance_data)
-        tracks = {}
+        # Dirty way to determine instance type to avoid circular dependency
-        label_cat = dataset.categories()[datumaro.AnnotationType.label]
+        if hasattr(instance_data, '_db_project'):
-
+            for sub_dataset, task_data in instance_data.split_dataset(dataset):
-        for item in dataset:
+                _import_task(sub_dataset, task_data)
-            frame_number = int(item.id) - 1 # NOTE: MOT frames start from 1
+        else:
-            frame_number = task_data.abs_frame_id(frame_number)
+            _import_task(dataset, instance_data)
            for ann in item.annotations:
                if ann.type != datumaro.AnnotationType.bbox:
                    continue
                track_id = ann.attributes.get('track_id')
                if track_id is None:
                    # Extension. Import regular boxes:
                    task_data.add_shape(task_data.LabeledShape(
                        type='rectangle',
                        label=label_cat.items[ann.label].name,
                        points=ann.points,
                        occluded=ann.attributes.get('occluded') == True,
                        z_order=ann.z_order,
                        group=0,
                        frame=frame_number,
                        attributes=[],
                        source='manual',
                    ))
                    continue
                shape = task_data.TrackedShape(
                    type='rectangle',
                    points=ann.points,
                    occluded=ann.attributes.get('occluded') == True,
                    outside=False,
                    keyframe=True,
                    z_order=ann.z_order,
                    frame=frame_number,
                    attributes=[],
                    source='manual',
                )
                # build trajectories as lists of shapes in track dict
                if track_id not in tracks:
                    tracks[track_id] = task_data.Track(
                        label_cat.items[ann.label].name, 0, 'manual', [])
                tracks[track_id].shapes.append(shape)
        for track in tracks.values():
            # MOT annotations do not require frames to be ordered
            track.shapes.sort(key=lambda t: t.frame)
            # insert outside=True in skips between the frames track is visible
            prev_shape_idx = 0
            prev_shape = track.shapes[0]
            for shape in track.shapes[1:]:
                has_skip = task_data.frame_step < shape.frame - prev_shape.frame
                if has_skip and not prev_shape.outside:
                    prev_shape = prev_shape._replace(outside=True,
                            frame=prev_shape.frame + task_data.frame_step)
                    prev_shape_idx += 1
                    track.shapes.insert(prev_shape_idx, prev_shape)
                prev_shape = shape
                prev_shape_idx += 1
            # Append a shape with outside=True to finish the track
            last_shape = track.shapes[-1]
            if last_shape.frame + task_data.frame_step <= \
                    int(task_data.meta['task']['stop_frame']):
                track.shapes.append(last_shape._replace(outside=True,
                    frame=last_shape.frame + task_data.frame_step)
                )
            task_data.add_track(track)
--- a/cvat/apps/dataset_manager/formats/mots.py
+++ b/cvat/apps/dataset_manager/formats/mots.py
@ -22,6 +22,77 @@ class KeepTracks(ItemTransform):
        return item.wrap(annotations=[a for a in item.annotations
            if 'track_id' in a.attributes])
 def _import_task(dataset, task_data):
    tracks = {}
    label_cat = dataset.categories()[AnnotationType.label]
    root_hint = find_dataset_root(dataset, task_data)
    shift = 0
    for item in dataset:
        frame_number = task_data.abs_frame_id(
            match_dm_item(item, task_data, root_hint=root_hint))
        track_ids = set()
        for ann in item.annotations:
            if ann.type != AnnotationType.polygon:
                continue
            track_id = ann.attributes['track_id']
            group_id = track_id
            if track_id in track_ids:
                # use negative id for tracks with the same id on the same frame
                shift -= 1
                track_id = shift
            else:
                track_ids.add(track_id)
            shape = task_data.TrackedShape(
                type='polygon',
                points=ann.points,
                occluded=ann.attributes.get('occluded') == True,
                outside=False,
                keyframe=True,
                z_order=ann.z_order,
                frame=frame_number,
                attributes=[],
                source='manual',
                group=group_id
            )
            # build trajectories as lists of shapes in track dict
            if track_id not in tracks:
                tracks[track_id] = task_data.Track(
                    label_cat.items[ann.label].name, 0, 'manual', [])
            tracks[track_id].shapes.append(shape)
    for track in tracks.values():
        track.shapes.sort(key=lambda t: t.frame)
        # insert outside=True in skips between the frames track is visible
        prev_shape_idx = 0
        prev_shape = track.shapes[0]
        for shape in track.shapes[1:]:
            has_skip = task_data.frame_step < shape.frame - prev_shape.frame
            if has_skip and not prev_shape.outside:
                prev_shape = prev_shape._replace(outside=True,
                        frame=prev_shape.frame + task_data.frame_step)
                prev_shape_idx += 1
                track.shapes.insert(prev_shape_idx, prev_shape)
            prev_shape = shape
            prev_shape_idx += 1
        # Append a shape with outside=True to finish the track
        last_shape = track.shapes[-1]
        if last_shape.frame + task_data.frame_step <= \
                int(task_data.meta['task']['stop_frame']):
            track.shapes.append(last_shape._replace(outside=True,
                frame=last_shape.frame + task_data.frame_step)
            )
        task_data.add_track(track)
@exporter(name='MOTS PNG', ext='ZIP', version='1.0')
 def _export(dst_file, instance_data, save_images=False):
    dataset = Dataset.from_extractors(GetCVATDataExtractor(
@ -37,79 +108,19 @@ def _export(dst_file, instance_data, save_images=False):
        make_zip_archive(temp_dir, dst_file)
@importer(name='MOTS PNG', ext='ZIP', version='1.0')
-def _import(src_file, task_data):
+def _import(src_file, instance_data, load_data_callback=None):
    with TemporaryDirectory() as tmp_dir:
        Archive(src_file.name).extractall(tmp_dir)
        dataset = Dataset.import_from(tmp_dir, 'mots', env=dm_env)
        dataset.transform('masks_to_polygons')
        if load_data_callback is not None:
            load_data_callback(dataset, instance_data)
-        tracks = {}
+        # Dirty way to determine instance type to avoid circular dependency
-        label_cat = dataset.categories()[AnnotationType.label]
+        if hasattr(instance_data, '_db_project'):
-
+            for sub_dataset, task_data in instance_data.split_dataset(dataset):
-        root_hint = find_dataset_root(dataset, task_data)
+                _import_task(sub_dataset, task_data)
-
+        else:
-        shift = 0
+            _import_task(dataset, instance_data)
        for item in dataset:
            frame_number = task_data.abs_frame_id(
                match_dm_item(item, task_data, root_hint=root_hint))
            track_ids = set()
            for ann in item.annotations:
                if ann.type != AnnotationType.polygon:
                    continue
                track_id = ann.attributes['track_id']
                group_id = track_id
                if track_id in track_ids:
                    # use negative id for tracks with the same id on the same frame
                    shift -= 1
                    track_id = shift
                else:
                    track_ids.add(track_id)
                shape = task_data.TrackedShape(
                    type='polygon',
                    points=ann.points,
                    occluded=ann.attributes.get('occluded') == True,
                    outside=False,
                    keyframe=True,
                    z_order=ann.z_order,
                    frame=frame_number,
                    attributes=[],
                    source='manual',
                    group=group_id
                )
                # build trajectories as lists of shapes in track dict
                if track_id not in tracks:
                    tracks[track_id] = task_data.Track(
                        label_cat.items[ann.label].name, 0, 'manual', [])
                tracks[track_id].shapes.append(shape)
        for track in tracks.values():
            track.shapes.sort(key=lambda t: t.frame)
            # insert outside=True in skips between the frames track is visible
            prev_shape_idx = 0
            prev_shape = track.shapes[0]
            for shape in track.shapes[1:]:
                has_skip = task_data.frame_step < shape.frame - prev_shape.frame
                if has_skip and not prev_shape.outside:
                    prev_shape = prev_shape._replace(outside=True,
                            frame=prev_shape.frame + task_data.frame_step)
                    prev_shape_idx += 1
                    track.shapes.insert(prev_shape_idx, prev_shape)
                prev_shape = shape
                prev_shape_idx += 1
            # Append a shape with outside=True to finish the track
            last_shape = track.shapes[-1]
            if last_shape.frame + task_data.frame_step <= \
                    int(task_data.meta['task']['stop_frame']):
                track.shapes.append(last_shape._replace(outside=True,
                    frame=last_shape.frame + task_data.frame_step)
                )
            task_data.add_track(track)
--- a/cvat/apps/dataset_manager/formats/openimages.py
+++ b/cvat/apps/dataset_manager/formats/openimages.py
@ -51,7 +51,7 @@ def _export(dst_file, task_data, save_images=False):
        make_zip_archive(temp_dir, dst_file)
@importer(name='Open Images V6', ext='ZIP', version='1.0')
-def _import(src_file, task_data):
+def _import(src_file, instance_data, load_data_callback=None):
    with TemporaryDirectory() as tmp_dir:
        Archive(src_file.name).extractall(tmp_dir)
@ -64,14 +64,14 @@ def _import(src_file, task_data):
            item_ids = list(find_item_ids(tmp_dir))
            root_hint = find_dataset_root(
-                [DatasetItem(id=item_id) for item_id in item_ids], task_data)
+                [DatasetItem(id=item_id) for item_id in item_ids], instance_data)
            for item_id in item_ids:
                frame_info = None
                try:
                    frame_id = match_dm_item(DatasetItem(id=item_id),
-                        task_data, root_hint)
+                        instance_data, root_hint)
-                    frame_info = task_data.frame_info[frame_id]
+                    frame_info = instance_data.frame_info[frame_id]
                except Exception: # nosec
                    pass
                if frame_info is not None:
@ -80,6 +80,8 @@ def _import(src_file, task_data):
        dataset = Dataset.import_from(tmp_dir, 'open_images',
            image_meta=image_meta, env=dm_env)
        dataset.transform('masks_to_polygons')
-        import_dm_annotations(dataset, task_data)
+        if load_data_callback is not None:
            load_data_callback(dataset, instance_data)
        import_dm_annotations(dataset, instance_data)
--- a/cvat/apps/dataset_manager/formats/pascal_voc.py
+++ b/cvat/apps/dataset_manager/formats/pascal_voc.py
@ -29,7 +29,7 @@ def _export(dst_file, instance_data, save_images=False):
        make_zip_archive(temp_dir, dst_file)
@importer(name='PASCAL VOC', ext='ZIP', version='1.1')
-def _import(src_file, instance_data):
+def _import(src_file, instance_data, load_data_callback=None):
    with TemporaryDirectory() as tmp_dir:
        Archive(src_file.name).extractall(tmp_dir)
@ -58,4 +58,6 @@ def _import(src_file, instance_data):
        dataset = Dataset.import_from(tmp_dir, 'voc', env=dm_env)
        dataset.transform('masks_to_polygons')
        if load_data_callback is not None:
            load_data_callback(dataset, instance_data)
        import_dm_annotations(dataset, instance_data)
--- a/cvat/apps/dataset_manager/formats/pointcloud.py
+++ b/cvat/apps/dataset_manager/formats/pointcloud.py
@ -28,15 +28,17 @@ def _export_images(dst_file, task_data, save_images=False):
@importer(name='Sly Point Cloud Format', ext='ZIP', version='1.0', dimension=DimensionType.DIM_3D)
-def _import(src_file, task_data):
+def _import(src_file, instance_data, load_data_callback=None):
-    if zipfile.is_zipfile(src_file):
+    with TemporaryDirectory() as tmp_dir:
-        with TemporaryDirectory() as tmp_dir:
+        if zipfile.is_zipfile(src_file):
            zipfile.ZipFile(src_file).extractall(tmp_dir)
            dataset = Dataset.import_from(tmp_dir, 'sly_pointcloud', env=dm_env)
-            import_dm_annotations(dataset, task_data)
+        else:
-    else:
+            dataset = Dataset.import_from(src_file.name,
-        dataset = Dataset.import_from(src_file.name,
+                                        'sly_pointcloud', env=dm_env)
-                                      'sly_pointcloud', env=dm_env)
+        if load_data_callback is not None:
-        import_dm_annotations(dataset, task_data)
+            load_data_callback(dataset, instance_data)
        import_dm_annotations(dataset, instance_data)
--- a/cvat/apps/dataset_manager/formats/registry.py
+++ b/cvat/apps/dataset_manager/formats/registry.py
@ -17,11 +17,11 @@ class _Format:
    ENABLED = True
 class Exporter(_Format):
-    def __call__(self, dst_file, task_data, **options):
+    def __call__(self, dst_file, instance_data, **options):
        raise NotImplementedError()
 class Importer(_Format):
-    def __call__(self, src_file, task_data, **options):
+    def __call__(self, src_file, instance_data, load_data_callback=None, **options):
        raise NotImplementedError()
 def _wrap_format(f_or_cls, klass, name, version, ext, display_name, enabled, dimension=DimensionType.DIM_2D):
--- a/cvat/apps/dataset_manager/formats/tfrecord.py
+++ b/cvat/apps/dataset_manager/formats/tfrecord.py
@ -32,9 +32,11 @@ def _export(dst_file, instance_data, save_images=False):
        make_zip_archive(temp_dir, dst_file)
@importer(name='TFRecord', ext='ZIP', version='1.0', enabled=tf_available)
-def _import(src_file, instance_data):
+def _import(src_file, instance_data, load_data_callback=None):
    with TemporaryDirectory() as tmp_dir:
        Archive(src_file.name).extractall(tmp_dir)
        dataset = Dataset.import_from(tmp_dir, 'tf_detection_api', env=dm_env)
        if load_data_callback is not None:
            load_data_callback(dataset, instance_data)
        import_dm_annotations(dataset, instance_data)
--- a/cvat/apps/dataset_manager/formats/velodynepoint.py
+++ b/cvat/apps/dataset_manager/formats/velodynepoint.py
@ -30,16 +30,17 @@ def _export_images(dst_file, task_data, save_images=False):
@importer(name='Kitti Raw Format', ext='ZIP', version='1.0', dimension=DimensionType.DIM_3D)
-def _import(src_file, task_data):
+def _import(src_file, instance_data, load_data_callback=None):
-    if zipfile.is_zipfile(src_file):
+    with TemporaryDirectory() as tmp_dir:
-        with TemporaryDirectory() as tmp_dir:
+        if zipfile.is_zipfile(src_file):
-            zipfile.ZipFile(src_file).extractall(tmp_dir)
+                zipfile.ZipFile(src_file).extractall(tmp_dir)
-            dataset = Dataset.import_from(
+                dataset = Dataset.import_from(
-                tmp_dir, 'kitti_raw', env=dm_env)
+                    tmp_dir, 'kitti_raw', env=dm_env)
-            import_dm_annotations(dataset, task_data)
+        else:
    else:
-        dataset = Dataset.import_from(
+            dataset = Dataset.import_from(
-            src_file.name, 'kitti_raw', env=dm_env)
+                src_file.name, 'kitti_raw', env=dm_env)
-        import_dm_annotations(dataset, task_data)
+        if load_data_callback is not None:
            load_data_callback(dataset, instance_data)
        import_dm_annotations(dataset, instance_data)
--- a/cvat/apps/dataset_manager/formats/vggface2.py
+++ b/cvat/apps/dataset_manager/formats/vggface2.py
@ -24,10 +24,12 @@ def _export(dst_file, instance_data, save_images=False):
        make_zip_archive(temp_dir, dst_file)
@importer(name='VGGFace2', ext='ZIP', version='1.0')
-def _import(src_file, instance_data):
+def _import(src_file, instance_data, load_data_callback=None):
    with TemporaryDirectory() as tmp_dir:
        zipfile.ZipFile(src_file).extractall(tmp_dir)
        dataset = Dataset.import_from(tmp_dir, 'vgg_face2', env=dm_env)
        dataset.transform('rename', r"|([^/]+/)?(.+)|\2|")
        if load_data_callback is not None:
            load_data_callback(dataset, instance_data)
        import_dm_annotations(dataset, instance_data)
--- a/cvat/apps/dataset_manager/formats/widerface.py
+++ b/cvat/apps/dataset_manager/formats/widerface.py
@ -24,9 +24,11 @@ def _export(dst_file, instance_data, save_images=False):
        make_zip_archive(temp_dir, dst_file)
@importer(name='WiderFace', ext='ZIP', version='1.0')
-def _import(src_file, instance_data):
+def _import(src_file, instance_data, load_data_callback=None):
    with TemporaryDirectory() as tmp_dir:
        zipfile.ZipFile(src_file).extractall(tmp_dir)
        dataset = Dataset.import_from(tmp_dir, 'wider_face', env=dm_env)
        if load_data_callback is not None:
            load_data_callback(dataset, instance_data)
        import_dm_annotations(dataset, instance_data)
--- a/cvat/apps/dataset_manager/formats/yolo.py
+++ b/cvat/apps/dataset_manager/formats/yolo.py
@ -28,7 +28,7 @@ def _export(dst_file, instance_data, save_images=False):
        make_zip_archive(temp_dir, dst_file)
@importer(name='YOLO', ext='ZIP', version='1.1')
-def _import(src_file, task_data):
+def _import(src_file, instance_data, load_data_callback=None):
    with TemporaryDirectory() as tmp_dir:
        Archive(src_file.name).extractall(tmp_dir)
@ -36,13 +36,13 @@ def _import(src_file, task_data):
        frames = [YoloExtractor.name_from_path(osp.relpath(p, tmp_dir))
            for p in glob(osp.join(tmp_dir, '**', '*.txt'), recursive=True)]
        root_hint = find_dataset_root(
-            [DatasetItem(id=frame) for frame in frames], task_data)
+            [DatasetItem(id=frame) for frame in frames], instance_data)
        for frame in frames:
            frame_info = None
            try:
-                frame_id = match_dm_item(DatasetItem(id=frame), task_data,
+                frame_id = match_dm_item(DatasetItem(id=frame), instance_data,
                    root_hint=root_hint)
-                frame_info = task_data.frame_info[frame_id]
+                frame_info = instance_data.frame_info[frame_id]
            except Exception: # nosec
                pass
            if frame_info is not None:
@ -50,4 +50,6 @@ def _import(src_file, task_data):
        dataset = Dataset.import_from(tmp_dir, 'yolo',
            env=dm_env, image_info=image_info)
-        import_dm_annotations(dataset, task_data)
+        if load_data_callback is not None:
            load_data_callback(dataset, instance_data)
        import_dm_annotations(dataset, instance_data)
--- a/cvat/apps/dataset_manager/project.py
+++ b/cvat/apps/dataset_manager/project.py
@ -2,16 +2,19 @@
 #
 # SPDX-License-Identifier: MIT
-from typing import Callable
+import rq
 from typing import Any, Callable, List, Mapping, Tuple
 from django.db import transaction
 from cvat.apps.engine import models
 from cvat.apps.engine.serializers import DataSerializer, TaskSerializer
 from cvat.apps.engine.task import _create_thread as create_task
 from cvat.apps.dataset_manager.task import TaskAnnotation
 from .annotation import AnnotationIR
-from .bindings import ProjectData
+from .bindings import ProjectData, load_dataset_data
-from .formats.registry import make_exporter
+from .formats.registry import make_exporter, make_importer
 def export_project(project_id, dst_file, format_name,
        server_url=None, save_images=False):
@ -21,35 +24,93 @@ def export_project(project_id, dst_file, format_name,
    # more dump request received at the same time:
    # https://github.com/opencv/cvat/issues/217
    with transaction.atomic():
-        project = ProjectAnnotation(project_id)
+        project = ProjectAnnotationAndData(project_id)
        project.init_from_db()
    exporter = make_exporter(format_name)
    with open(dst_file, 'wb') as f:
        project.export(f, exporter, host=server_url, save_images=save_images)
-class ProjectAnnotation:
+class ProjectAnnotationAndData:
    def __init__(self, pk: int):
        self.db_project = models.Project.objects.get(id=pk)
        self.db_tasks = models.Task.objects.filter(project__id=pk).order_by('id')
        self.task_annotations: dict[int, TaskAnnotation] = dict()
        self.annotation_irs: dict[int, AnnotationIR] = dict()
        self.tasks_to_add: list[models.Task] = []
    def reset(self):
        for annotation_ir in self.annotation_irs.values():
            annotation_ir.reset()
-    def put(self, data):
+    def put(self, tasks_data: Mapping[int,Any]):
-        raise NotImplementedError()
+        for task_id, data in tasks_data.items():
-
+            self.task_annotations[task_id].put(data)
-    def create(self, data):
+
-        raise NotImplementedError()
+    def create(self, tasks_data: Mapping[int,Any]):
-
+        for task_id, data in tasks_data.items():
-    def update(self, data):
+            self.task_annotations[task_id].create(data)
-        raise NotImplementedError()
+
-
+    def update(self, tasks_data: Mapping[int,Any]):
-    def delete(self, data=None):
+        for task_id, data in tasks_data.items():
-        raise NotImplementedError()
+            self.task_annotations[task_id].update(data)
    def delete(self, tasks_data: Mapping[int,Any]=None):
        if tasks_data is not None:
            for task_id, data in tasks_data.items():
                self.task_annotations[task_id].put(data)
        else:
            for task_annotation in self.task_annotations.values():
                task_annotation.delete()
    def add_task(self, task_fields: dict, files: dict, project_data: ProjectData = None):
        def split_name(file):
            _, name = file.split(files['data_root'])
            return name
        data_serializer = DataSerializer(data={
            "server_files": files['media'],
            #TODO: followed fields whould be replaced with proper input values from request in future
            "use_cache": False,
            "use_zip_chunks": True,
            "image_quality": 70,
        })
        data_serializer.is_valid(raise_exception=True)
        db_data = data_serializer.save()
        db_task = TaskSerializer.create(None, {
            **task_fields,
            'data_id': db_data.id,
            'project_id': self.db_project.id
        })
        data = {k:v for k, v in data_serializer.data.items()}
        data['use_zip_chunks'] = data_serializer.validated_data['use_zip_chunks']
        data['use_cache'] = data_serializer.validated_data['use_cache']
        data['copy_data'] = data_serializer.validated_data['copy_data']
        data['server_files_path'] = files['data_root']
        data['stop_frame'] = None
        data['server_files'] = list(map(split_name, data['server_files']))
        create_task(db_task, data, isDatasetImport=True)
        self.db_tasks = models.Task.objects.filter(project__id=self.db_project.id).order_by('id')
        self.init_from_db()
        if project_data is not None:
            project_data.new_tasks.add(db_task.id)
            project_data.init()
    def add_labels(self, labels: List[models.Label], attributes: List[Tuple[str, models.AttributeSpec]] = None):
        for label in labels:
            label.project = self.db_project
            # We need label_id here, so we can't use bulk_create here
            label.save()
        for label_name, attribute in attributes or []:
            label, = filter(lambda l: l.name == label_name, labels)
            attribute.label = label
        if attributes:
            models.AttributeSpec.objects.bulk_create([a[1] for a in attributes])
    def init_from_db(self):
        self.reset()
@ -57,6 +118,7 @@ class ProjectAnnotation:
        for task in self.db_tasks:
            annotation = TaskAnnotation(pk=task.id)
            annotation.init_from_db()
            self.task_annotations[task.id] = annotation
            self.annotation_irs[task.id] = annotation.ir_data
    def export(self, dst_file: str, exporter: Callable, host: str='', **options):
@ -66,6 +128,37 @@ class ProjectAnnotation:
            host=host
        )
        exporter(dst_file, project_data, **options)
    def load_dataset_data(self, *args, **kwargs):
        load_dataset_data(self, *args, **kwargs)
    def import_dataset(self, dataset_file, importer):
        project_data = ProjectData(
            annotation_irs=self.annotation_irs,
            db_project=self.db_project,
            task_annotations=self.task_annotations,
            project_annotation=self,
        )
        project_data.soft_attribute_import = True
        importer(dataset_file, project_data, self.load_dataset_data)
        self.create({tid: ir.serialize() for tid, ir in self.annotation_irs.items() if tid in project_data.new_tasks})
    @property
    def data(self) -> dict:
        raise NotImplementedError()
@transaction.atomic
 def import_dataset_as_project(project_id, dataset_file, format_name):
    rq_job = rq.get_current_job()
    rq_job.meta['status'] = 'Dataset import has been started...'
    rq_job.meta['progress'] = 0.
    rq_job.save_meta()
    project = ProjectAnnotationAndData(project_id)
    project.init_from_db()
    importer = make_importer(format_name)
    with open(dataset_file, 'rb') as f:
        project.import_dataset(f, importer)
--- a/cvat/apps/dataset_manager/task.py
+++ b/cvat/apps/dataset_manager/task.py
@ -6,7 +6,6 @@
 from collections import OrderedDict
 from enum import Enum
 from django.conf import settings
 from django.db import transaction
 from django.utils import timezone
@ -17,6 +16,7 @@ from cvat.apps.profiler import silk_profile
 from .annotation import AnnotationIR, AnnotationManager
 from .bindings import TaskData
 from .formats.registry import make_exporter, make_importer
 from .util import bulk_create
 class dotdict(OrderedDict):
@ -39,21 +39,6 @@ class PatchAction(str, Enum):
    def __str__(self):
        return self.value
 def bulk_create(db_model, objects, flt_param):
    if objects:
        if flt_param:
            if 'postgresql' in settings.DATABASES["default"]["ENGINE"]:
                return db_model.objects.bulk_create(objects)
            else:
                ids = list(db_model.objects.filter(**flt_param).values_list('id', flat=True))
                db_model.objects.bulk_create(objects)
                return list(db_model.objects.exclude(id__in=ids).filter(**flt_param))
        else:
            return db_model.objects.bulk_create(objects)
    return []
 def _merge_table_rows(rows, keys_for_merge, field_id):
    # It is necessary to keep a stable order of original rows
    # (e.g. for tracked boxes). Otherwise prev_box.frame can be bigger
--- a/cvat/apps/dataset_manager/util.py
+++ b/cvat/apps/dataset_manager/util.py
@ -6,6 +6,7 @@
 import inspect
 import os, os.path as osp
 import zipfile
 from django.conf import settings
 def current_function_name(depth=1):
@ -18,3 +19,19 @@ def make_zip_archive(src_path, dst_path):
            for name in filenames:
                path = osp.join(dirpath, name)
                archive.write(path, osp.relpath(path, src_path))
 def bulk_create(db_model, objects, flt_param):
    if objects:
        if flt_param:
            if 'postgresql' in settings.DATABASES["default"]["ENGINE"]:
                return db_model.objects.bulk_create(objects)
            else:
                ids = list(db_model.objects.filter(**flt_param).values_list('id', flat=True))
                db_model.objects.bulk_create(objects)
                return list(db_model.objects.exclude(id__in=ids).filter(**flt_param))
        else:
            return db_model.objects.bulk_create(objects)
    return []
--- a/cvat/apps/engine/serializers.py
+++ b/cvat/apps/engine/serializers.py
@ -220,6 +220,7 @@ class RqStatusSerializer(serializers.Serializer):
    state = serializers.ChoiceField(choices=[
        "Queued", "Started", "Finished", "Failed"])
    message = serializers.CharField(allow_blank=True, default="")
    progress = serializers.FloatField(max_value=100, default=0)
 class WriteOnceMixin:
@ -726,6 +727,15 @@ class LogEventSerializer(serializers.Serializer):
 class AnnotationFileSerializer(serializers.Serializer):
    annotation_file = serializers.FileField()
 class DatasetFileSerializer(serializers.Serializer):
    dataset_file = serializers.FileField()
    @staticmethod
    def validate_dataset_file(value):
        if os.path.splitext(value.name)[1] != '.zip':
            raise serializers.ValidationError('Dataset file should be zip archive')
        return value
 class TaskFileSerializer(serializers.Serializer):
    task_file = serializers.FileField()
--- a/cvat/apps/engine/task.py
+++ b/cvat/apps/engine/task.py
@ -53,13 +53,16 @@ def rq_handler(job, exc_type, exc_value, traceback):
 ############################# Internal implementation for server API
-def _copy_data_from_share(server_files, upload_dir):
+def _copy_data_from_source(server_files, upload_dir, server_dir=None):
    job = rq.get_current_job()
-    job.meta['status'] = 'Data are being copied from share..'
+    job.meta['status'] = 'Data are being copied from source..'
    job.save_meta()
    for path in server_files:
-        source_path = os.path.join(settings.SHARE_ROOT, os.path.normpath(path))
+        if server_dir is None:
            source_path = os.path.join(settings.SHARE_ROOT, os.path.normpath(path))
        else:
            source_path = os.path.join(server_dir, os.path.normpath(path))
        target_path = os.path.join(upload_dir, path)
        if os.path.isdir(source_path):
            copy_tree(source_path, target_path)
@ -218,14 +221,16 @@ def _get_manifest_frame_indexer(start_frame=0, frame_step=1):
@transaction.atomic
-def _create_thread(tid, data, isImport=False):
+def _create_thread(db_task, data, isBackupRestore=False, isDatasetImport=False):
-    slogger.glob.info("create task #{}".format(tid))
+    if isinstance(db_task, int):
        db_task = models.Task.objects.select_for_update().get(pk=db_task)
    slogger.glob.info("create task #{}".format(db_task.id))
    db_task = models.Task.objects.select_for_update().get(pk=tid)
    db_data = db_task.data
    upload_dir = db_data.get_upload_dirname()
-    if data['remote_files']:
+    if data['remote_files'] and not isDatasetImport:
        data['remote_files'] = _download_data(data['remote_files'], upload_dir)
    manifest_file = []
@ -236,7 +241,7 @@ def _create_thread(tid, data, isImport=False):
    if data['server_files']:
        if db_data.storage == models.StorageChoice.LOCAL:
-            _copy_data_from_share(data['server_files'], upload_dir)
+            _copy_data_from_source(data['server_files'], upload_dir, data.get('server_files_path'))
        elif db_data.storage == models.StorageChoice.SHARE:
            upload_dir = settings.SHARE_ROOT
        else: # cloud storage
@ -297,12 +302,12 @@ def _create_thread(tid, data, isImport=False):
        if media_files:
            if extractor is not None:
                raise Exception('Combined data types are not supported')
-            if isImport and media_type == 'image' and db_data.storage == models.StorageChoice.SHARE:
+            if (isDatasetImport or isBackupRestore) and media_type == 'image' and db_data.storage == models.StorageChoice.SHARE:
                manifest_index = _get_manifest_frame_indexer(db_data.start_frame, db_data.get_frame_step())
                db_data.start_frame = 0
                data['stop_frame'] = None
                db_data.frame_filter = ''
-            if isImport and media_type != 'video' and db_data.storage_method == models.StorageMethodChoice.CACHE:
+            if isBackupRestore and media_type != 'video' and db_data.storage_method == models.StorageMethodChoice.CACHE:
                # we should sort media_files according to the manifest content sequence
                manifest = ImageManifestManager(db_data.get_manifest_path())
                manifest.set_index()
@ -319,9 +324,9 @@ def _create_thread(tid, data, isImport=False):
                del sorted_media_files
                data['sorting_method'] = models.SortingMethod.PREDEFINED
            source_paths=[os.path.join(upload_dir, f) for f in media_files]
-            if manifest_file and not isImport and data['sorting_method'] in {models.SortingMethod.RANDOM, models.SortingMethod.PREDEFINED}:
+            if manifest_file and not isBackupRestore and data['sorting_method'] in {models.SortingMethod.RANDOM, models.SortingMethod.PREDEFINED}:
                raise Exception("It isn't supported to upload manifest file and use random sorting")
-            if isImport and db_data.storage_method == models.StorageMethodChoice.FILE_SYSTEM and \
+            if isBackupRestore and db_data.storage_method == models.StorageMethodChoice.FILE_SYSTEM and \
                    data['sorting_method'] in {models.SortingMethod.RANDOM, models.SortingMethod.PREDEFINED}:
                raise Exception("It isn't supported to import the task that was created without cache but with random/predefined sorting")
@ -377,12 +382,11 @@ def _create_thread(tid, data, isImport=False):
        if not hasattr(update_progress, 'call_counter'):
            update_progress.call_counter = 0
-        status_template = 'Images are being compressed {}'
+        status_message = 'Images are being compressed'
-        if progress:
+        if not progress:
-            current_progress = '{}%'.format(round(progress * 100))
+            status_message = '{} {}'.format(status_message, progress_animation[update_progress.call_counter])
-        else:
+        job.meta['status'] = status_message
-            current_progress = '{}'.format(progress_animation[update_progress.call_counter])
+        job.meta['task_progress'] = progress or 0.
        job.meta['status'] = status_template.format(current_progress)
        job.save_meta()
        update_progress.call_counter = (update_progress.call_counter + 1) % len(progress_animation)
--- a/cvat/apps/engine/tests/test_rest_api.py
+++ b/cvat/apps/engine/tests/test_rest_api.py
@ -1470,6 +1470,165 @@ class ProjectExportAPITestCase(APITestCase):
        self._check_xml(pid, user, 3)
 class ProjectImportExportAPITestCase(APITestCase):
    def setUp(self) -> None:
        self.client = APIClient()
        self.tasks = []
        self.projects = []
    @classmethod
    def setUpTestData(cls) -> None:
        create_db_users(cls)
        cls.media_data = [
            {
                **{
                   **{"client_files[{}]".format(i): generate_image_file("test_{}.jpg".format(i))[1] for i in range(10)},
                },
                **{
                    "image_quality": 75,
                },
            },
            {
                **{
                   **{"client_files[{}]".format(i): generate_image_file("test_{}.jpg".format(i))[1] for i in range(10)},
                },
                "image_quality": 75,
            },
        ]
    def _create_tasks(self):
        self.tasks = []
        def _create_task(task_data, media_data):
            response = self.client.post('/api/v1/tasks', data=task_data, format="json")
            assert response.status_code == status.HTTP_201_CREATED
            tid = response.data["id"]
            for media in media_data.values():
                if isinstance(media, io.BytesIO):
                    media.seek(0)
            response = self.client.post("/api/v1/tasks/{}/data".format(tid), data=media_data)
            assert response.status_code == status.HTTP_202_ACCEPTED
            response = self.client.get("/api/v1/tasks/{}".format(tid))
            data_id = response.data["data"]
            self.tasks.append({
                "id": tid,
                "data_id": data_id,
            })
        task_data = [
            {
                "name": "my task #1",
                "owner_id": self.owner.id,
                "assignee_id": self.assignee.id,
                "overlap": 0,
                "segment_size": 100,
                "project_id": self.projects[0]["id"],
            },
            {
                "name": "my task #2",
                "owner_id": self.owner.id,
                "assignee_id": self.assignee.id,
                "overlap": 1,
                "segment_size": 3,
                "project_id": self.projects[0]["id"],
            },
        ]
        with ForceLogin(self.owner, self.client):
            for data, media in zip(task_data, self.media_data):
                _create_task(data, media)
    def _create_projects(self):
        self.projects = []
        def _create_project(project_data):
            response = self.client.post('/api/v1/projects', data=project_data, format="json")
            assert response.status_code == status.HTTP_201_CREATED
            self.projects.append(response.data)
        project_data = [
            {
                "name": "Project for export",
                "owner_id": self.owner.id,
                "assignee_id": self.assignee.id,
                "labels": [
                    {
                        "name": "car",
                        "color": "#ff00ff",
                        "attributes": [{
                            "name": "bool_attribute",
                            "mutable": True,
                            "input_type": AttributeType.CHECKBOX,
                            "default_value": "true"
                        }],
                    }, {
                        "name": "person",
                    },
                ]
            }, {
                "name": "Project for import",
                "owner_id": self.owner.id,
                "assignee_id": self.assignee.id,
            },
        ]
        with ForceLogin(self.owner, self.client):
            for data in project_data:
                _create_project(data)
    def _run_api_v1_projects_id_dataset_export(self, pid, user, query_params=""):
        with ForceLogin(user, self.client):
            response = self.client.get("/api/v1/projects/{}/dataset?{}".format(pid, query_params), format="json")
        return response
    def _run_api_v1_projects_id_dataset_import(self, pid, user, data, f):
        with ForceLogin(user, self.client):
            response = self.client.post("/api/v1/projects/{}/dataset?format={}".format(pid, f),  data=data, format="multipart")
        return response
    def _run_api_v1_projects_id_dataset_import_status(self, pid, user):
        with ForceLogin(user, self.client):
            response = self.client.get("/api/v1/projects/{}/dataset?action=import_status".format(pid), format="json")
        return response
    def test_api_v1_projects_id_export_import(self):
        self._create_projects()
        self._create_tasks()
        pid_export, pid_import = self.projects[0]["id"], self.projects[1]["id"]
        response = self._run_api_v1_projects_id_dataset_export(pid_export, self.owner, "format=CVAT for images 1.1")
        self.assertEqual(response.status_code, status.HTTP_202_ACCEPTED)
        response = self._run_api_v1_projects_id_dataset_export(pid_export, self.owner, "format=CVAT for images 1.1")
        self.assertEqual(response.status_code, status.HTTP_201_CREATED)
        response = self._run_api_v1_projects_id_dataset_export(pid_export, self.owner, "format=CVAT for images 1.1&action=download")
        self.assertEqual(response.status_code, status.HTTP_200_OK)
        self.assertTrue(response.streaming)
        tmp_file = tempfile.NamedTemporaryFile(suffix=".zip")
        tmp_file.write(b"".join(response.streaming_content))
        tmp_file.seek(0)
        import_data = {
            "dataset_file": tmp_file,
        }
        response = self._run_api_v1_projects_id_dataset_import(pid_import, self.owner, import_data, "CVAT 1.1")
        self.assertEqual(response.status_code, status.HTTP_202_ACCEPTED)
        response = self._run_api_v1_projects_id_dataset_import_status(pid_import, self.owner)
        self.assertEqual(response.status_code, status.HTTP_201_CREATED)
    def tearDown(self) -> None:
        for task in self.tasks:
            shutil.rmtree(os.path.join(settings.TASKS_ROOT, str(task["id"])))
            shutil.rmtree(os.path.join(settings.MEDIA_DATA_ROOT, str(task["data_id"])))
        for project in self.projects:
            shutil.rmtree(os.path.join(settings.PROJECTS_ROOT, str(project["id"])))
 class TaskListAPITestCase(APITestCase):
    def setUp(self):
        self.client = APIClient()
--- a/cvat/apps/engine/views.py
+++ b/cvat/apps/engine/views.py
@ -60,7 +60,7 @@ from cvat.apps.engine.serializers import (
    LogEventSerializer, ProjectSerializer, ProjectSearchSerializer,
    RqStatusSerializer, TaskSerializer, UserSerializer, PluginsSerializer, ReviewSerializer,
    CombinedReviewSerializer, IssueSerializer, CombinedIssueSerializer, CommentSerializer,
-    CloudStorageSerializer, BaseCloudStorageSerializer, TaskFileSerializer,)
+    CloudStorageSerializer, BaseCloudStorageSerializer, TaskFileSerializer, DatasetFileSerializer)
 from utils.dataset_manifest import ImageManifestManager
 from cvat.apps.engine.utils import av_scan_paths
 from cvat.apps.engine.backup import import_task
@ -312,7 +312,7 @@ class ProjectViewSet(auth.ProjectGetQuerySetMixin, viewsets.ModelViewSet):
                type=openapi.TYPE_STRING, required=False),
            openapi.Parameter('action', in_=openapi.IN_QUERY,
                description='Used to start downloading process after annotation file had been created',
-                type=openapi.TYPE_STRING, required=False, enum=['download'])
+                type=openapi.TYPE_STRING, required=False, enum=['download', 'import_status'])
        ],
        responses={'202': openapi.Response(description='Exporting has been started'),
            '201': openapi.Response(description='Output file is ready for downloading'),
@ -320,20 +320,68 @@ class ProjectViewSet(auth.ProjectGetQuerySetMixin, viewsets.ModelViewSet):
            '405': openapi.Response(description='Format is not available'),
        }
    )
-    @action(detail=True, methods=['GET'], serializer_class=None,
+    @swagger_auto_schema(method='post', operation_summary='Import dataset in specific format as a project',
        manual_parameters=[
            openapi.Parameter('format', openapi.IN_QUERY,
                description="Desired dataset format name\nYou can get the list of supported formats at:\n/server/annotation/formats",
                type=openapi.TYPE_STRING, required=True)
        ],
        responses={'202': openapi.Response(description='Exporting has been started'),
            '400': openapi.Response(description='Failed to import dataset'),
            '405': openapi.Response(description='Format is not available'),
        }
    )
    @action(detail=True, methods=['GET', 'POST'], serializer_class=None,
        url_path='dataset')
-    def dataset_export(self, request, pk):
+    def dataset(self, request, pk):
        db_project = self.get_object() # force to call check_object_permissions
-        format_name = request.query_params.get("format", "")
+        if request.method == 'POST':
-        return _export_annotations(db_instance=db_project,
+            format_name = request.query_params.get("format", "")
-            rq_id="/api/v1/project/{}/dataset/{}".format(pk, format_name),
+
-            request=request,
+            return _import_project_dataset(
-            action=request.query_params.get("action", "").lower(),
+                request=request,
-            callback=dm.views.export_project_as_dataset,
+                rq_id=f"/api/v1/project/{pk}/dataset_import",
-            format_name=format_name,
+                rq_func=dm.project.import_dataset_as_project,
-            filename=request.query_params.get("filename", "").lower(),
+                pk=pk,
-        )
+                format_name=format_name,
            )
        else:
            action = request.query_params.get("action", "").lower()
            if action in ("import_status",):
                queue = django_rq.get_queue("default")
                rq_job = queue.fetch_job(f"/api/v1/project/{pk}/dataset_import")
                if rq_job is None:
                    return Response(status=status.HTTP_404_NOT_FOUND)
                elif rq_job.is_finished:
                    os.close(rq_job.meta['tmp_file_descriptor'])
                    os.remove(rq_job.meta['tmp_file'])
                    rq_job.delete()
                    return Response(status=status.HTTP_201_CREATED)
                elif rq_job.is_failed:
                    os.close(rq_job.meta['tmp_file_descriptor'])
                    os.remove(rq_job.meta['tmp_file'])
                    rq_job.delete()
                    return Response(
                        data=str(rq_job.exc_info),
                        status=status.HTTP_500_INTERNAL_SERVER_ERROR
                    )
                else:
                    return Response(
                        data=self._get_rq_response('default', f'/api/v1/project/{pk}/dataset_import'),
                        status=status.HTTP_202_ACCEPTED
                    )
            else:
                format_name = request.query_params.get("format", "")
                return _export_annotations(
                    db_instance=db_project,
                    rq_id="/api/v1/project/{}/dataset/{}".format(pk, format_name),
                    request=request,
                    action=action,
                    callback=dm.views.export_project_as_dataset,
                    format_name=format_name,
                    filename=request.query_params.get("filename", "").lower(),
                )
    @swagger_auto_schema(method='get', operation_summary='Method allows to download project annotations',
        manual_parameters=[
@ -372,6 +420,24 @@ class ProjectViewSet(auth.ProjectGetQuerySetMixin, viewsets.ModelViewSet):
        else:
            return Response("Format is not specified",status=status.HTTP_400_BAD_REQUEST)
    @staticmethod
    def _get_rq_response(queue, job_id):
        queue = django_rq.get_queue(queue)
        job = queue.fetch_job(job_id)
        response = {}
        if job is None or job.is_finished:
            response = { "state": "Finished" }
        elif job.is_queued:
            response = { "state": "Queued" }
        elif job.is_failed:
            response = { "state": "Failed", "message": job.exc_info }
        else:
            response = { "state": "Started" }
            response['message'] = job.meta.get('status', '')
            response['progress'] = job.meta.get('progress', 0.)
        return response
 class TaskFilter(filters.FilterSet):
    project = filters.CharFilter(field_name="project__name", lookup_expr="icontains")
    name = filters.CharFilter(field_name="name", lookup_expr="icontains")
@ -859,6 +925,7 @@ class TaskViewSet(UploadMixin, auth.TaskGetQuerySetMixin, viewsets.ModelViewSet)
            response = { "state": "Started" }
            if 'status' in job.meta:
                response['message'] = job.meta['status']
            response['progress'] = job.meta.get('task_progress', 0.)
        return response
@ -1608,8 +1675,8 @@ def _export_annotations(db_instance, rq_id, request, format_name, action, callba
        return Response(status=status.HTTP_405_METHOD_NOT_ALLOWED)
    queue = django_rq.get_queue("default")
    rq_job = queue.fetch_job(rq_id)
    if rq_job:
        last_instance_update_time = timezone.localtime(db_instance.updated_date)
        if isinstance(db_instance, Project):
@ -1659,3 +1726,38 @@ def _export_annotations(db_instance, rq_id, request, format_name, action, callba
        meta={ 'request_time': timezone.localtime() },
        result_ttl=ttl, failure_ttl=ttl)
    return Response(status=status.HTTP_202_ACCEPTED)
 def _import_project_dataset(request, rq_id, rq_func, pk, format_name):
    format_desc = {f.DISPLAY_NAME: f
        for f in dm.views.get_import_formats()}.get(format_name)
    if format_desc is None:
        raise serializers.ValidationError(
            "Unknown input format '{}'".format(format_name))
    elif not format_desc.ENABLED:
        return Response(status=status.HTTP_405_METHOD_NOT_ALLOWED)
    queue = django_rq.get_queue("default")
    rq_job = queue.fetch_job(rq_id)
    if not rq_job:
        serializer = DatasetFileSerializer(data=request.data)
        if serializer.is_valid(raise_exception=True):
            dataset_file = serializer.validated_data['dataset_file']
            fd, filename = mkstemp(prefix='cvat_{}'.format(pk))
            with open(filename, 'wb+') as f:
                for chunk in dataset_file.chunks():
                    f.write(chunk)
            rq_job = queue.enqueue_call(
                func=rq_func,
                args=(pk, filename, format_name),
                job_id=rq_id,
                meta={
                    'tmp_file': filename,
                    'tmp_file_descriptor': fd,
                },
            )
    else:
        return Response(status=status.HTTP_409_CONFLICT, data='Import job already exists')
    return Response(status=status.HTTP_202_ACCEPTED)
--- a/cvat/requirements/base.txt
+++ b/cvat/requirements/base.txt
@ -1,3 +1,4 @@
 attrs==21.2.0
 click==7.1.2
 Django==3.1.13
 django-appconf==1.0.4
--- a/tests/cypress/support/commands_projects.js
+++ b/tests/cypress/support/commands_projects.js
@ -71,7 +71,7 @@ Cypress.Commands.add('exportProject', ({
    projectName, type, dumpType, archiveCustomeName,
 }) => {
    cy.projectActions(projectName);
-    cy.get('.cvat-project-actions-menu').contains('Export project dataset').click();
+    cy.get('.cvat-project-actions-menu').contains('Export dataset').click();
    cy.get('.cvat-modal-export-project').should('be.visible').find('.cvat-modal-export-select').click();
    cy.contains('.cvat-modal-export-option-item', dumpType).should('be.visible').click();
    cy.get('.cvat-modal-export-select').should('contain.text', dumpType);