Panduan

Best Practise for Research Data Management

Data Organisation

Mengapa File Penting Dikelola?

Penting bagi Anda dan kolega Anda untuk memutuskan bagaimana Anda akan memberi nama dan menyusun file dan folder data penelitian Anda di awal proses perencanaan proyek. Mempertahankan strategi pengorganisasian file yang konsisten dapat menghemat banyak waktu dan sakit kepala, dan ini juga untuk memastikan Anda dan orang lain yang memerlukan akses ke data penelitian dapat menemukan dan memahaminya dalam periode yang berbeda.

File Structure

Bagaimana Anda bisa menyimpan data Anda dalam folder secara sistematis?

a. Tentukan jenis data dan format file

Berikut beberapa contohnya:

  • Gambar dari lapangan (.jpeg)
  • Laporan kemajuan & presentasi (.docx, .pptx & .pdf)
  • Observasi lapangan (.xlsx & .csv)
  • File analisis & grafik (.xlsx & .R)

b. Sertakan informasi kontekstual penting

Saat Anda mencari file data tertentu, bagaimana pendapat Anda tentangnya? Anda mungkin ingin mempertimbangkan untuk memasukkan jenis informasi kontekstual berikut saat Anda mengatur folder data Anda?

  • Tanggal
  • Kolaborator
  • Metode pengumpulan data
  • Lokasi
  • Tipe data

Apakah Anda pernah mengalami pengalaman yang sama? Tidak tahu di mana menemukan file data Anda? Tidak ingat isi file datanya?

c. Membuat struktur folder file hierarki

Struktur file hierarki dapat membuat organisasi file Anda lebih sistematis.

d. Atur folder berdasarkan kategori yang bermakna

Berdasarkan informasi kontekstual, Anda akan dapat mengatur folder dengan cara yang lebih bermakna dan sistematis. Berikut beberapa contohnya:

[Proyek] / [Sub-proyek] / [Eksperimen] / [Instrumen] / [Tanggal]

[Area penelitian] / [Proyek] / [Data atau dokumentasi] / [Tanggal]

Penamaan File

Mengembangkan penamaan berdasarkan elemen yang penting bagi proyek. Hal ini memungkinkan Anda dan orang lain yang membutuhkan akses ke data menemukan file dengan mudah dan melacak catatan data secara efisien.

Anda dapat mempertimbangkan elemen berikut dalam penamaan file Anda:

Tanggal/ Rentang tanggal

  • Judul studi/ Nama proyek
  • Lokasi
  • Nomor versi
  • Isi file
  • Jenis tanggal
  • Nama/Inisial peneliti

Berikut beberapa tips lainnya:

Penamaan file harus konsisten

  • Usahakan untuk tidak memiliki nama file yang terlalu panjang (biasanya tidak lebih dari 25 karakter)
  • Hindari karakter khusus (yaitu ~ ! @ # $ % ^ & * ( ) ` ; < > ?. , [ ] { } ‘ ” |) dalam nama file
  • Jangan gunakan spasi. Sebagai gantinya, berikut beberapa opsi alternatif: huruf kapital (mis. Nama File.xxx), garis bawah (mis. Nama_File.xxx)
  • Gunakan format tanggal YYYYMMDD
  • Sertakan nomor versi
Data Versioning

Anda harus mengetahui versi data penelitian Anda saat Anda menyimpan salinan baru file Anda. Menerapkan kebijakan pembuatan versi data yang tepat pada kumpulan data Anda akan menghemat banyak waktu saat Anda perlu mengambil versi tertentu dari file Anda di masa mendatang.

Berikut adalah beberapa saran:

Sertakan nomor versi, misalnya “v1,” “v2,” atau “v2.1. Misalnya, DataFileName_1.0 = dokumen asli; DataFileName_1.1 = dokumen asli dengan sedikit revisi; DataFileName_2.0 = dokumen dengan banyak revisi

Sertakan informasi tentang perubahan apa yang dilakukan, misalnya. “dipotong” atau “dinormalisasi”

Sumber:

Data best practices and case studies, Stanford University Libraries; https://guides.library.stanford.edu/c.php?g=1186700

Research Data Management, National University of Singapore https://libguides.nus.edu.sg/rdm/data_organisation

Metadata & Documentation

Lisensi & Hak Cipta

Format Data

Memilih Format File
Mengubah Format File
Panduan Format File

Penting bagi Anda untuk memutuskan format apa yang akan dipilih untuk data penelitian Anda ketika Anda mulai merencanakan proyek penelitian Anda, karena format ini menentukan bagaimana data dapat digunakan, dianalisis, disimpan, dan digunakan kembali di masa depan.

Berikut beberapa pertanyaan yang mungkin perlu Anda pertimbangkan.

  • Jenis data apa yang akan dihasilkan?
  • Apakah Anda menggunakan format file yang standar untuk file Anda?
  • Apakah Anda menggunakan format file yang umum digunakan di area penelitian Anda?
  • Apakah format ini mudah dibagikan kepada kolega Anda atau orang lain yang memerlukan akses ke data?
  • Apakah format ini memfasilitasi penggunaan dan penggunaan kembali data Anda di masa mendatang (misalnya, standar terbuka/non-kepemilikan)?
  • Apakah ada kondisi khusus untuk membaca dan memanipulasi data penelitian Anda (misalnya, sistem operasi, perangkat lunak, atau alat)?

Anda disarankan untuk menyimpan salinan data dalam format file asli saat mengonversinya ke format file lain. File asli dapat digunakan untuk memperbaiki kerusakan yang tidak terduga selama konversi. Misalnya, konversi file mungkin memiliki risiko kehilangan informasi tertentu seperti yang tercantum di bawah ini:

  • Hilangnya konten (data)
  • Hilangnya karakteristik file yang disimpan di dalam file (metadata)
  • Hilangnya tata letak atau format (misalnya dalam file teks)
  • Penurunan kualitas (misalnya pada file grafik atau video)

Sumber: Research data management - looking after file formats, University of Amsterdam link (https://rdm.uva.nl/en/looking-after/file-formats/file-formats.html?cb)

Tabel berikut berisi panduan tentang format file yang direkomendasikan dan diterima yang diadopsi dari UK Data Archive. (https://ukdataservice.ac.uk/learning-hub/research-data-management/format-your-data/recommended-formats/ )

Type of data

Recommended formats

Other acceptable formats

Quantitative tabular data with extensive metadata.

A dataset with variable labels, code labels, and defined missing values, in addition to the matrix of data.

Proprietary formats of statistical packages e.g. SPSS (.sav), Stata (.dta), .sas7bdat.

Delimited text and command (‘setup’) file (SPSS, Stata, SAS, etc.) containing metadata information.

Some structured text or mark-up file containing metadata information, e.g. DDI XML file.

SPSS portable format (.por).

MS Access (.mdb/.accdb).

Quantitative tabular data with minimal metadata.

A matrix of data with or without column headings or variable names, but no other metadata or labeling.

Comma-separated values (CSV) file (.csv).

Tab-delimited file (.tab).

Including delimited text of given character set with SQL data definition statements where appropriate.

Delimited text of given character set – only characters not present in the data may be used as delimiters (.txt).

Widely-used formats: MS Excel (.xls/.xlsx), MS Access (.mdb/.accdb), OpenDocument Spreadsheet (.ods).

Geospatial data.

Vector and raster data.

SRI Shapefile (essential – .shp, .shx, .dbf, optional – .prj, .sbx, .sbn).

Geo-referenced TIFF (.tif, .tfw).

CAD data (.dwg).

Tabular GIS attribute data.

ESRI Geodatabase format (.mdb).

MapInfo Interchange Format (.mif) for vector data.

Keyhole Mark-up Language (.kml).

Adobe Illustrator (.ai), CAD data (.dxf or .svg).

Binary formats of GIS and CAD packages.

Qualitative data.

Textual.

eXtensible Mark-up Language (XML) text according to an appropriate Document Type Definition (DTD) or schema (.xml).

Rich Text Format (.rtf).

Plain text data, ASCII (.txt).

Hypertext Mark-up Language (.html).

Widely-used formats: MS Word (.doc/.docx).

Some software-specific formats: NUD*IST, NVivo and ATLAS.ti.

Digital image data.

TIFF version 6 uncompressed (.tif).

Digital Imaging and Communications in Medicine (DICOM) (.dcm, .dcm30) – for CT/MRI data.

JPEG (.jpeg, .jpg) but only if created in this format.

TIFF (other versions) (.tif, .tiff).

Adobe Portable Document Format (PDF/A, PDF) (.pdf).

Standard applicable RAW image format (.raw).

Photoshop files (.psd).

BMP (.bmp) but only if created in this format.

PNG (.png) but only if created in this format.

Digital audio data.

Free Lossless Audio Codec (FLAC) (.flac).

MPEG-1 Audio Layer 3 (.mp3) if original created in this format.

Audio Interchange File Format (.aif).

Waveform Audio Format (.wav).

Digital video data.

MPEG-4 (.mp4).

OGG video (.ogv, .ogg).

motion JPEG 2000 (.mj2).

MOV (.mov)

Windows Media Video (WMV) (.wmv).

WebM (.webm).

Documentation and scripts.

ich Text Format (.rtf).

PDF/A or PDF (.pdf).

HTML (.htm).

OpenDocument Text (.odt).

R Markdown files (.rmd) (with HTML version as well).

Plain text (.txt).

Widely-used proprietary formats: MS Word (.doc/.docx), MS Excel (.xls/.xlsx).

XML marked-up text (.xml) according to an appropriate DTD or schema, e.g. XHMTL 1.0.

Metadata & Documentation

Metadata adalah informasi terstruktur yang mendeskripsikan, menjelaskan, menemukan lokasi, atau mempermudah pengambilan, penggunaan, atau pengelolaan sumber informasi.

“Metadata memfasilitasi dan mendukung penemuan, identifikasi, pengorganisasian, dan interoperabilitas keluaran penelitian. Memiliki metadata yang kaya akan membantu memaksimalkan pemaparan, penggunaan kembali, dan kutipan temuan penelitian Anda.”

 (Diadaptasi dari Sumber: Australian Research Data Commons https://ardc.edu.au/resource/metadata/ )

Table Tipe Data

Berikut adalah tabel tipe metadata yang diadaptasi dari National Information Standards Organization Amerika Serikat.

Tipe Metadata

Contoh

Primary

Metadata deskriptif

Bidang umum yang membantu pengguna menemukan sumber online melalui pencarian dan penjelajahan

  • Judul
  • Pengarang
  • Subjek
  • Genre
  • Tanggal penerbitan
  • Penemuan
  • Display
  • Interoperabilitas

Metadata teknis

Bidang yang menjelaskan informasi yang diperlukan untuk mengakses data

  • Jenis berkas
  • Ukuran file
  • Tanggal/waktu pembuatan
  • Skema kompresi
  • Interoperabilitas
  • Manajemen objek digital
  • Kelestarian

Metadata Administratif untuk Pelestarian

Bidang yang memudahkan pengelolaan sumber daya

  • Jumlah pemeriksaan
  • Acara pelestarian
  • Interoperabilitas
  • Manajemen objek digital
  • Kelestarian

Metadata Administratif tentang Hak

Bidang yang berhubungan dengan hak kekayaan intelektual

  • Status hak cipta
  • Persyaratan lisensi
  • Pemegang hak
  • Interoperabilitas
  • Manajemen objek digital

Metadata struktural

Bidang yang mendeskripsikan bagaimana berbagai komponen kumpulan data terkait berhubungan satu sama lain

  • Urutan
  • Tempatkan dalam hierarki

Navigasi

Bahasa markup

Bahasa yang mengintegrasikan metadata dan tanda untuk fitur struktural atau semantik lainnya dalam konten

  • Paragraf
  • Daftar Judul
  • Nama
  • Tanggal
  • Navigasi
  • Interoperabilitas
Format dan Standar Metadata

Standar/skema metadata dapat bervariasi dari satu disiplin ilmu ke disiplin lainnya. Dublin Core adalah salah satu standar metadata generik yang paling umum digunakan.

Dublin Core sederhana melibatkan 15 elemen (opsional & dapat diulang):

 

  • Judul
  • Subjek
  • Format
  • Tanggal
  • Sumber
  • Pengidentifikasi
  • Jenis
  • Keterangan
  • Bahasa
  • Hak
  • Penerbit
  • Hubungan
  • Pencipta
  • Penyumbang
  • Cakupan

Sumber: Dublin Core Metadata Initiative (DCMI https://www.dublincore.org/specifications/dublin-core/dcmi-terms/