Butir data atau biasa disebut datum adalah  satuan terkecil data (satu nilai untuk satu variabel tertentu). Data adalah kumpulan butir data yang membawa satu kesatuan makna (mendeskripsikan satu objek) tertentu, dan himpunan data (dataset) merupakan kumpulan data. Struktur data dibagi menjadi 3 jenis, antara lain:

  1. Data terstruktur adalah data yang butir-butirnya tersusun secara jelas mengikuti sebuah struktur yang ditentukan oleh suatu model data tertentu.
  2. Data tidak terstruktur adalah data yang butir-butirnya tidak dengan jelas tersusun mengikuti suatu model data tertentu.
  3. Data semi-terstruktur adalah data terstruktur yang tidak mengikuti model struktur tabular yang seperti pada basis data relasional, namun tetap mengandung tags atau penanda lainnya yang dapat memisahkan elemen-elemen semantik pada data serta mengatur hierarki antara butir-butir datanya.

Sifat data terstruktur yaitu:

  1. Model data terdefinisikan sebelumnya
  2. Format butir data (biasanya) teks
  3. Antar butir data terbedakan dengan jelas
  4. Ekstraksi/kueri langsung cukup mudah.

Sifat data tidak terstruktur yaitu:

  1. Model data tidak terdefinisikan sebelumnya
  2. Format butir data (biasanya) teks, citra, suara, video, dan format lainnya
  3. Antar butir data tidak cukup jelas terbedakan karena ketidakteraturan dan ambiguitas
  4. Ekstraksi/kueri langsung cukup sulit.