音频标注
无损格式:例如WAV、FLAC、APE、ALAC、CDA
有损格式:例如MP3、AAC、Opus
所以我们在标注的时候使用的原始数据WAV格式也会多一些。其标注的结果文件除了上面通用的标注文件格式外,还有用Praat软件标注的后级名为“TextGrid”的文件,它是一种“分段”文件,详细记录了语音的总时长、每一个标注层内所有标注区间的时长及标注内容等信息
视频标注
视频数据标注任务的数据结果可包含视频标签的时间位置、空间位置和标签信息等内容。不同标注任务和要求会产出不同的结果,但不影响定义数据格式及其组成部分。
标注文件的输出格式推荐使用易解析、易存储的数据格式, 包括JSON、XML等
医疗标注
影像数据(CT/DR)
RAW,裸格式:就是最原始的图像,没有经过任何处理,拍出来是什么样就是什么样;
BMP格式:BMP不压缩,可以任意选择图像灰度深度或图像位数;
DICOM格式:DICOM是一种统一的兼容各种CT,MRI,PET等医学影像的图像存储方式;.dcm文件就是遵循DICOM标注的一种文件。
DICOM标准支持的设备包括心电图、核磁共振成像、心血管、超声心动图等多种医疗社保,因而DCM文件被广泛应用于医疗行业。一张CT片子对应多个.dcm文件