做数据标注的你,和即将从事这个行业的大家,是不是都有遇到过文件打开是乱码、文件后缀不常见,提示没有应用软件可以打开……一系列的问题呢?
特别是刚进入数据标注这个行业,或者是平时不太玩电脑对计算机了解较浅的小伙伴们,是蒙圈不知道该如何处理,今天呢,砸门就梳理一些关于数据标注文件格式的基础知识,作为新手的你一定要了解一下哟
文件格式
文件格式(或文件类型)是指电脑为了存储信息而使用的对信息的特殊编码方式,是用于识别内部储存的资料。比如有的储存图片,有的储存程序,有的储存文字信息。
每一类信息,都可以一种或多种文件格式保存在电脑存储中。每一种文件格式通常会有一种或多种扩展名可以用来识别,但也可能没有扩展名。扩展名可以帮助应用程序识别的文件格式
对于硬盘机或任何电脑存储来说,有效的信息只有0和1两种,所以电脑必须设计有相应的方式进行信息-位元的转换。对于不同的信息有不同的存储格式,文件格式也意味着文件的用途
我们日常常用的扩展名有哪些
1.办公软件中的Word文件.docx,PPT文件.pptx,Excel文件.xlsx;
2.图形文件多以.png、.jpg、.gif结尾;
3.音乐和视频文件则是.mp3、.mp4、.wav、.wmv;
4.文本.txt;
windows环境下的可执行文件.exe
对于这些扩展名大家习以为常,并不觉得奇怪,那么在数据标注的过程中,我们可能会遇到哪些文件格式呢?