Pobierz PDF - PROBLEMS OF FORENSIC SCIENCES

Transkrypt

Pobierz PDF - PROBLEMS OF FORENSIC SCIENCES
Problems of Forensic Sciences 2016, vol. 105, 355–369
TesT audio recordings and Their use in auThenTiciTy
examinaTions. daTabase of properTies of digiTal
audio recorders and recordings
Marcin Michałek
Institute of Forensic Research, Kraków, Poland
summary
currently, there are many brands and models of devices with a digital audio recording function and with different recording parameters. at present, experts almost exclusively receive digital devices and recordings stored using digital technology for forensic audio examination – these have almost entirely replaced analogue techniques in the field of multimedia. The aim of this study
was to collect devices with a digital audio recording function, and then make test recordings with these devices and determine
the possibility of converting them into a standard format. a database containing the parameters of the analysed recorders and
their recordings was created as part of this study. The test recordings were made in available recording formats for each recorder
and under different acoustic conditions. it was determined that the largest groups of analysed recorders was voice recorders
(75%), followed by mobile phones (19%) and other devices with an audio recording function, such as multimedia players, tablets and cameras (6% in total). The test recordings were made in 18 different recording formats, which were characterized by
different quality and parameters. The most numerous formats were: WaVe aDPcM, WMa and MP3. The conducted research
and results, as well as the constructed database, are helpful for experts investigating the authenticity of audio recordings.
Key words
authentic recording; Database; Digital recorder; Test recording.
Received 20 June 2016; accepted 29 September 2016
1. introduction
The technique of digital recording and editing
of data has been applied in particular to multimedia
documents (ho, Li, 2015; Savage, Vogel, 2014). currently, the prevalence and diversity of digital devices with a recording capacity is increasing – not only
voice recorders and video cameras dedicated to this
purpose, but also other generally used devices, such
as mobile phones, tablets, cameras, multimedia players and various types of flash drives (memory sticks)
with a recording function (ho, Li, 2015; Michałek,
2014). Just a few years ago, evidentiary analogue
recordings constituted the clear majority among evidentiary recordings, with just a small proportion of
digital recordings. Now, thanks to the prevalence of
digital devices, expert reports concerning analysis of
analogue recordings are rare. expert practice indicates
that evidentiary digital recordings are mostly made not
with high quality professional equipment, but rather
with widely used consumer devices, such as those
mentioned above (Michałek, 2014).
Due to the large number of brands and models of
recorders, there are currently many audio recording
formats, which are distinguished by various parameters (casey, Turnbull, 2011; ho, Li, 2015; Urbański,
1989). in forensic audio analysis, the best solution is
to import a recording into the working space of professional programmes designed for listening to and
analysing recordings. Such programmes usually rec-
356
M. Michałek
ognise many common recording formats. However,
some producers, even well-known, use their own, often non-standard, recording formats in their own recorders, which require conversion to standard format
for the purpose of importing them into analysing software. Therefore, it is important to have a programme
which will make such a conversion, for example into
the form of uncompressed WaVe PcM.
The fact of acceptance of recordings as evidence
material by a judicial body and also the range of requested analyses results in the necessity of evaluating their authenticity (cooper, 2006; Grigoras, 2005;
hong, Yin, 2013; kajstura, Trawińska, hebenstreit,
2005; koenig, 1990; korycki, 2011; Michałek, 2009).
The definition of the authenticity of a recording given
by the audio engineering Society (aeS) indicates the
necessity of establishing its continuity and originality and hence the method of recording (aeS, 1996).
The prevalence of equipment and software used for
digital editing of recordings has created broad possibilities of interfering in their content (kirn, 2007; korbecki, 1999; Sztekmiler, 2003). That is why currently
authentications of digital recordings require a combination of various forensic audio methods, as well as
the co-participation of tools from the field of forensic
informatics.
an important element in the process of authenticating a digital recording is making test recordings
with the help of the device that is believed to have
been used to make the digital recording. These test recordings allow you to carry out a comparative analysis
of their parameters and file structure in relation to the
evidentiary recording. They also enable you to verify
whether the recorder is working correctly, to study its
properties and to establish whether it could really have
been used to make the evidentiary recording (cooper,
2006; hong, Yin, 2013; koenig, Lacey, 2012).
Digital recorders that are currently generally available enable you to choose recording parameters, resulting in recordings of varying quality. The wide variety
of brands and models of these devices and of the formats of recordings has compelled us to undertake research in this field. in this paper, the process of making
test audio recordings and analysing their parameters
has been described. The test recordings were made using the collected recording devices, making use of the
range of available settings and recording functions. On
this basis, a database has been constructed containing
information about the studied recording devices and
the recorded test recordings, together with access to
original audio files. The database also contains a list
of programmes enabling conversion of recordings to
the standard format – WaVe PcM. The constructed
database constitutes a tool that can aid experts in the
authentication of digital audio recordings.
2. Thesignificanceandmakingoftest
recordings
When carrying out an authentication of a recording, special attention should be paid to the stage linked
with making test recordings. Could an evidential recording have been tampered with? is it original? Was
it recorded using a particular recorder? – these are
among the most frequent questions posed by judicial
bodies and related to forensic audio analysis. In order
to answer them, it is necessary to carry out an analysis
of the recording’s authenticity.
The evidential material collected in the case may
include – apart from the recording – the recorder
which is believed to have been used to make the recording. if the judicial body has not provided the given recording device, the expert should request that it
be secured and submitted to him/her for examination.
The recorder can be used to make test recordings and
carry out a comparative auditory analysis as well as
an analysis of the parameters and characteristics – and
also of possible traces indicating discontinuity – in
relation to the evidential recording. In this way it is
possible to establish methods of copying recordings
from and to the memory of the device in question. This
stage of testing also allows you to establish whether
the analysed device is working properly and can record. Before the expert starts to study the recorder and
make test recordings, its current settings must be verified – including the date and time – and data must
be secured from the memory by making copies of its
contents. This enables a comparison of the content of
the memory of the recorder after finishing the analysis
with the state before beginning analysis. If the device
allows it the expert should make a so-called memory image as well as calculate checksums, for example
with an MD5 algorithm, both for the physical area of
the imaged memory of the device, and – for the purpose of verification – for its image. This is aimed at
securing the memory of the data carrier in the state in
which it was submitted for analysis, which has great
significance for results and conclusions drawn on this
basis (Breeuwsma, De Jongh, klaver, Van Der knijff,
Roeloffs, 2007; casey, 2010).
Before making test recordings, it is necessary to
carry out a thorough auditory analysis as well as an
analysis of parameters and characteristics of the evidential recording for the purpose of establishing what
sounds were recorded and in what acoustic conditions.
Problems of Forensic Sciences 2016, vol. 105, 355–369
Test audio recordings and their use in authenticity examinations. Database of properties of digital audio recorders and...
The expert should also familiarize with the recording
possibilities, the functions of the recording device
and the power supply options, by analysing the operating manual and the available menu as well as by
assessing the technical state. This will enable you to
draw up a plan for making test recordings, containing
a description of their execution, the sequence of recordings and the sequence of played back sounds as
well as the applied parameters and functions. a plan
is necessary both for carrying out and archiving these
activities and for later analysis of recordings. A good,
tried and tested practice in the course of making each
of the test recording is to create a written description:
the date and time of the beginning and the end of the
recording, the place of recording and current acoustic
conditions, the brand and model of the device, power
supply, parameters of the recording and applied functions as well as successively recorded signals.
In the course of making test recordings in acoustically isolated rooms, signals of previously defined
duration and frequency ranges, such as basic tones
and noises are generated, and speech and intentional interferences are also recorded. if it is significant
for the results of analyses and possible to carry out,
the test recordings should be made in the place where
the event was recorded or in acoustic conditions that
are similar to them and contain sounds corresponding
to those from the analysed recording. Test recordings
should be made using the available functions and recording parameters of the given device; additionally,
recordings should be repeated several times for each
setting, for the purpose of mutual verification. This
will allow complete analysis of time and frequency
characteristics of these recordings as well as possible
characteristic traces that have arisen as a result of using the pause function, automatic stopping of the recording or editing, which cause interruptions in the
continuity of the recording. Test recordings allow you
to determine whether the device enables recording of
the hum signal, and to reveal other possible characteristic features, such as generation of signals of constant or variable time-frequency parameters and the
Dc offset (cooper, 2006; Grigoras, cooper, Michałek,
2009; kajstura, Trawińska, hebenstreit, 2005; korycki, 2011; Michałek, 2009). if the DTMF signal – as
well as interferences resulting from mobile phone use
and other signals that have standard time and frequency parameters – have been recorded on the evidentiary
recording, then these parameters can also be recorded
on test recordings in order to verify them.
analysis of the structure of audio files is also carried out as part of authenticity investigations of digital recordings. Such files contain so-called metada-
357
ta, which describe relevant data with encoded sound
(Gloe, Fisher, kirchner, 2014; hong, Yin, 2013; koenig, Lacey, 2012). Such an analysis is carried out using
software enabling visualisation and editing of files in
the form of hexadecimal code.
Metadata in audio files contain information that is
significant for authentication investigations. in particular, the format of a recording and the parameters
of a multi-media file can be found within the so-called
header, situated at the beginning of a block of data.
additionally, the following can be saved in the header:
the date and time of the recording, the duration of the
recording, the brand and model of the device, the size
of the file and the size of the part containing the encoded sound. Metadata are also stored within so-called
tags, for example in iD3 tags applied in the popular
MP3 audio file format. as a result of editing an audio
file using programmes designed for this purpose, very
often entries arise in the file structure, for example in
XML or XMP format. Such additional metadata, as
practice shows, are usually saved in the end part of
the data structure of the edited file. it should be added
that currently many different audio formats exist and
each of them usually has a different structure. Making
test recordings creates an opportunity for comparative
analysis of the data structure of the test recordings
with the structure of the evidential file.
It might seem that making test recordings is relatively simple – consisting basically in switching on the
recording function, recording the desired sounds, and
then turning off the recording function – in comparison
to other forensic audio analyses. However, contrary to
appearances, it is a complicated and time-consuming
task. The expert needs to carry out a detailed analysis of the evidentiary recording and preliminarily prepares the recording device and planned actions as well
as makes the recordings in accordance with a planned
schedule, copy them, and later carry out a laborious
comparative analysis in relation to – sometimes numerous – evidentiary recordings.
Digital audio recorders – which are affordable and
easy-to-use nowadays – offer the possibility of changing the quality of a recording, although they often have
manufacturer’s pre-defined settings. More advanced
recorders enable a change in such parameters, for example: number of channels, sampling rate, bit resolution, recording in compressed or uncompressed format, and audio format. In addition, they have a builtin clock which can be set, are equipped with a pause
function or voice-activated recording, noise filtering,
and they even enable editing of recordings by removing fragments or combining them. The above results
in a large number of possible combinations of settings
Problems of Forensic Sciences 2016, vol. 105, 355–369
358
M. Michałek
during recording, which is reflected in the number of
test recordings. Table 1 presents parameters and functions that can be changed in two typical generally
available audio recorders, and the resultant number of
combinations of recording settings for double repetition of each setting. additional functions or parameters increase the number of combinations of settings.
Table 1
Settable parameters and functions and the number of
their combinations for two different audio recorders
Recording parameters
and functions
Recorder 1
Recorder 2
Audio format
WaVe
aDPcM
MP3
WMa
Number of quality
settings
2
2
6
Continuous recording
Yes
Yes
Pause function
None
Manual and
automatic
Number of combinations
of settings
2
6
18
Number of recordings
with double repetition
of each setting
4
12
36
3. research material
3.1. Digital recorders
in order to perform the research, nearly 120 commonly available devices with a digital audio recording function, such as voice recorders, mobile phones,
multi-media players with a recording function, tablets
and video cameras were collected and analysed. The
following brands of devices were studied in the present research: apple, BlackBerry, creative, hTc, JVc,
LG, Marantz, Nokia, Olympus, Panasonic, Pentagram, Philips, Roland, Samsung, Siemens, Sony, Tascam, Toshiba, Track and Zoom. Test recordings were
saved on internal and removable memories, both flash
and MiniDisc.
Before making the test recordings, the operating
manual, recording capabilities and technical state was
studied carefully and the photographic documentation
was made for every device.
3.2. Digital sound recordings
Using the collected devices, over 720 digital audio
recordings were saved in 18 different audio formats.
After saving in the memory of the recorder, each of
the test recordings was copied onto the hard disk of the
laboratory computer for further analysis or an image
was made of the content of the memory of the device.
Test recordings were made using all possible recording settings of the studied devices as well as
available functions such as start and stop of recording,
pause function, voice-activated recording, indexing,
filtering background noise, as well as possible editing
of recordings. Test recordings were made in various
acoustic conditions, recording the broadest possible
range of sounds. In acoustically isolated rooms, using
a computer work station equipped with monitor speakers and headphones, the following were generated and
recorded: wide-frequency noise, tones in low, medium
and high frequency ranges, pulsed and continuous interference, and speech. Using the examined recorders,
sounds in open space associated with street traffic were
also recorded as well as sounds inside moving vehicles. Speech at constant and changing distances from
the microphones of the recording devices were also
recorded in the acoustic conditions described above.
4. Analysisofthepropertiesofthetested
devices and test recordings
Conducting test recordings enabled analysis of the
properties of the studied devices. as mentioned, as
part of the research, nearly 120 devices with a digital
audio recording function were collected and analysed.
Table 2 presents the results of analysis of the properties of the devices used to make the test recordings.
The table contains the following information: the
brands of the collected recorders, their types, numbers
of formats, capability of changing the quality of recording for available formats and saving of audio files
as uncompressed or compressed files.
Using the collected recording devices, test recordings were made in 18 different recording formats,
i.e.,: 3GP, aiFF, aMR, BWF, DSS, M4a, MP2, MP3,
MOD, OMa, OMG, PVc, WaVe aDPcM, WaVe
PcM, VM1, VY2 (VY4), VYF and WMa. Table 3
shows the percentage share of the most frequently occurring formats in relation to the general number of
recordings.
The performed analysis showed that a significant
majority of test recordings were conducted using digital voice recorders and in three dominant recording
formats, i.e., WaVe aDPcM, WMa and MP3. Most
of the studied devices recorded in only one file format,
but a considerable number of them allowed a choice
between two or even three different formats. in the
Problems of Forensic Sciences 2016, vol. 105, 355–369
359
Test audio recordings and their use in authenticity examinations. Database of properties of digital audio recorders and...
Table 2
Properties of digital devices used to make audio test recordings
Brand
Olympus
(58%)
Sony
(8%)
Nokia, Tascam, Samsung
(each 5%)
Others
(19%)
Type
Voice recorder
(75%)
Mobile phone
(19%)
Multimedia player
(3%)
Tablet, video camera
(3%)
Number of audio
formats
One
(59%)
Two
(25%)
Three
(15%)
More than three
(1%)
Quality setting
Yes
(87%)
No
(23%)
compression
Uncompressed and compressed audio files
(32%)
Only compressed audio files
(68%)
Table 3
The proportion of most frequent audio file formats (as a percentage of all test recordings)
Audio format
Proportion [%]
WaVe aDPcM
WMa
MP3
AMR
WaVe PcM
3GP
M4a
Others
42
26
10
7
5
3
2
5
event of a recorder being able to record in more than
two formats, the most frequently encountered were:
WMa and MP3 (using compression) and WaVe PcM
(uncompressed). individual devices amongst those analysed enabled recording in more than three formats –
these devices were mainly technically advanced audio
recorders. an example of such a device is the Marantz
PMD671, which lets you record audio in four different formats, including two uncompressed ones, i.e.,
WaVe PcM and BWF. From the conducted analysis
it also transpires that most of the studied devices allow you to choose the recording quality and change
parameters for a specific format. This group mainly includes voice recorders with recording in WMa, MP3
and WaVe PcM formats. in turn, devices recording
in aMR format, i.e., mainly cellular phones, as well
as certain voice recorders and media players with a recording function in the WaVe aDPcM format, do
not allow to change recording parameters and thus to
choose quality.
it was established that the parameters of all conducted test recordings lay within the following ranges:
resolution 4–24 bits per sample, sampling rate 8–96
khz, bit rate 5–2304 kbps and frequency band range
approximately 3.8–40 khz. Low values correspond
to recordings of low quality with a narrow frequency band, recorded with the help of algorithms characterised by strong compression. in turn, high values
are characteristic of recordings of high quality with
a broad frequency band, recorded mainly in WaVe
PcM uncompressed format.
all the tested recorders allow to copy files containing recordings onto the hard disk of a computer using
a digital connector. Some of them, especially older
models, only allow to transfer files containing recordings using dedicated manufacturer’s software installed
in the operating system of the computer. For example,
Olympus voice recorders and models in the VN series
use Digital Wave Player, whilst Sony recorders, when
saving on removable media carriers such as MiniDisc,
for example model MZ-Nh900, require installation
of SonicStage. The other recorders allow to directly
copy files from their memory onto a hard disk for the
purpose of further analysis. On this basis, it was established that each of the studied recorders automatically
gave names to audio files (containing recordings) according to an established scheme. example names of
sound files for specific device models are presented
below. The names of these files indicate:
– the recorder model and the successive number of
the recording, for example: DS500001.WMa,
WS650001.MP3 or 801_0182.MP3 (Olympus
models: DS-50, WS-650S, and WS-801 respectively), DR-100_0001.WaV (Tascam DR-100), and
R09_0001.WaV (Roland eDiROL R-09);
– transfer using dedicated software, labelling the folder of the saved recording in the memory of the device and the recording number: DW_a0001.WaV
(Digital Wave Player software, folder a; this naming system is used in the case of Olympus recorders
and models such as VN-120Pc, VN-1100Pc, VN2000Pc, VN-2100Pc and VN-3100Pc);
Problems of Forensic Sciences 2016, vol. 105, 355–369
360
M. Michałek
– date or date and time of recording: VN20160216-00001.amr (BlackBerry 9320), recording-20130809-121814.MP3 (Pentagram Tab
7.5), 001-2009-10-08 11_49_40.oma (Sony MZNh900); the part of the file name indicating the
time depends on the built-in clock settings in the
device;
– number of the recording: 1001.WaV (Marantz
PMD671);
– the following names have also been noted: audio, Głos, Mic, MOB, Nagr, Nagranie, Plik audio,
Rec, Sound clip, Voice or VOc together with the
successive recording number in the memory of the
device; such names of audio files are characteristic, above all, for cellular phones and media players
with a recording function.
audio files containing test recordings in each analysed recording format possess metadata – of greater
or lesser extensiveness – concerning: the brand and
model of the recorder, the recording properties, the
date, time and duration of the recording or amount of
data in the file. as noted above, important information
is also included in the names of the saved files.
in Figure 1, a fragment of data structure in an audio file in the WaVe aDPcM format – the type of
format noted most frequently among test recordings –
has been visualised in the form of hexadecimal (on the
left) and aScii code (on the right). The region of the
file header which contains metadata with entries indicating the number of data in the file (00 10 8e 34
bytes in hexadecimal notation, in little-endian order),
format (WaVe aDPcM, codec iMa, code 00 11), basic parameters of the recording (1 channel, sampling
rate 22 050 hz, bit rate 88.8 kbps, resolution 4 bits
per sample) and number of data with encoded audio
(00 10 8e 00 bytes) has been marked in the figure.
audio files recorded by Olympus recorders are
particularly noteworthy, containing easy to decode entries indicating the brand and model of the device, the
date and the time of the beginning and end of the recording, the duration of the recording and its number,
and the parameters of the audio recording. Such data
are recorded by most Olympus models.
Figure 2 shows two fragments of data structure of
an audio file recorded using an Olympus WS-650S
recorder in the second most common format among
test recordings, i.e., WMa. The first part of the structure (Fig 2a) contains metadata indicating the brand
of the recorder (Olympus), model (WS650S), date
and time of the beginning and end of the recording
(2010.01.04, from 16:50:58 to 17:43:57) and recording time (00:52:59). in turn, in the second part (Figure 2b), the parameters of the recording are indicated,
i.e., format (WMa), bit rate (32 kbps), sampling rate
(44 khz) and the number of channels (1).
Programmes for automatic analysis of multimedia
files sometimes only give some parameters of the recording, or sometimes these values may be inaccurate;
it may also happen that they do not recognise a given format at all. Then the main source of information
about such a file is analysis of its data structure using
a hex editor, which has been briefly described above.
5. Databaseofpropertiesofdigitalsound
recorders and recordings as well as
possibilitiesoftheirconversionto
WAVEPCMformat
as part of the work carried out, all recorders used
for making test recordings were systematically catalogued. The following information is stored in the
main catalogue for each recorder: information relating
to technical and photographic documentation, software for conversion from source format to standard
and uncompressed WaVe PcM format, as well as the
test recordings themselves in source format and converted to WaVe PcM format.
The collection of catalogued and structured information constituted the basis for constructing a relational database in Microsoft Access together with
a user interface. This database contains the following
information for each studied device: the type of device, a description of the make and model, documentation, the of type of recording (audio or video), a list of
available audio file recording formats and extensions,
Fig. 1. The file header of a recording stored in WaVe aDPcM audio file format.
Problems of Forensic Sciences 2016, vol. 105, 355–369
Test audio recordings and their use in authenticity examinations. Database of properties of digital audio recorders and...
361
a)
b)
Fig. 2. information and parameters of a recording stored in WMa audio file format by Olympus recorder.
Fig. 3. View of the main table of the constructed database containing information about analysed recorders and test recordings.
a description of basic recording parameters, access
to the catalogue with files in source formats and converted formats as well as to the catalogue with programmes for conversion of recordings to WaVe PcM
format. A fragment of the view of the main table of the
created database is presented in Figure 3.
inputting audio files containing recordings in their
source format into the database enables to perform
a comparative analysis of parameters between recordings made using the same models of a given brand
(make) and also between analysed evidentiary recordings. Collecting together structured data about digital sound recorders and about parameters of their recordings and programmes for conversion in one place
enables quick access to significant information when
carrying out forensic audio analysis and saves a signif-
icant amount of time. having a database with an open
structure enables to update it with further information
and recordings.
it is usually possible to play back a recording using
the device on which it was recorded; however, in the
course of forensic audio analysis, professional computer software serving to play and analyse recordings
is used. Sometimes the material collected for analysis
does not include the device on which the recording in
question was made. Therefore it was analysed the possibility of playing back saved test recordings in their
source formats and converting to standard and uncompressed format, i.e., WaVe PcM, using computer
programmes. Playing back in the source format often
gives you the possibility of preliminarily assessing the
recording and establishing the recorded content. In
Problems of Forensic Sciences 2016, vol. 105, 355–369
362
M. Michałek
turn, conversion to WaVe PcM format allows you to
import the recording into the working space of professional programmes for the purpose of performing
auditory analysis and making a transcription, analysing time and frequency characteristics in the course
of authenticity analyses, as well as parameters of the
speech signal during speaker identification studies.
currently popular recording formats, such as
WaVe PcM and aDMcP, MPeG-1 and MPeG-2
audio Layer iii (MP3), WMa, 3GP or aMR are wellknown and documented (3GPP, 2010; 3GPP, 2011;
iSO/iec, 1992; Microsoft corp., 1994, Microsoft
corp., 2010). Many useful tools allowing their analysis and playback, and conversion to uncompressed
WaVe PcM are available. however, some producers
of digital audio recorders use their own, non-standard
recording formats accompanied by very poor documentation or even no generally available documentation. Playing back such a recording and converting it
to the WaVe PcM format for the purpose of analysis
in appropriate software is thus problematic. it may
also turn out that analysis of the data structure of files
containing such recordings and decoding of metadata
is only possible to a limited extent.
among free programmes which enable to play
back or convert most standard formats of recording
to WaVe PcM, the following can be distinguished:
Pazera Free audio extractor, operated from the command-line ffmpeg and ffplay, Mobile Media converter and VLc media player. During the study, adobe
audition professional software was also used. The
mentioned programmes enabled conversion of test recordings from the following formats: WaVe aDPcM,
WMa, aMR, MP3, MP2, 3GP, M4a, aiFF, MOD
and BWF to the uncompressed WaVe PcM format.
For test recordings saved in less popular formats,
it was essential to use dedicated software by the manufacturer of the given recorder to play them back and
convert them to WaVe PcM format. The collected test
recordings in sound files with the extensions: VM1,
PVc, DSS, VY2 (VY4), and VYF as well as OMa
and OMG can be played back and converted using
software, respectively: Voice editing, Voice editing
Mini Player and Voice editing, DSS Player Lite and
DSS Player v.7, Voice yepp Player and WaV_converter, Samsung Voice Manager and SonicStage.
6. summary
The paper describes the significance and use of
audio test recordings in the authentication of evidential recordings. it has been presented the properties of
devices with a sound recording function and the parameters of test recordings made on them, as well as
a database constructed on this basis. The structured
collection of data enables to quickly verify the parameters of a specific model of a recorder and its recordings, as well as determine the necessary software for
conversion from source format to PcM WaVe, which
enables further analysis of recordings. The open structure of the constructed collection allows you to update
it and supplement it with new data as you analyse successive recording devices.
The results of the performed analyses and the mentioned database are used in current expert witnessing
practice as aids in the authentication of recordings. it
should be added that the created collection of information on digital recording devices and their recordings
can certainly be helpful in investigations not only in
the field of audio forensics, but also in related fields,
for example, forensic informatics. The database also
provides adequate material for carrying out other analyses of audio recordings.
Acknowledgements
The research work described in this article was carried
out under research project no. X/k at the institute of Forensic Research in kraków.
References
1. 3rd Generation Partnership Project (3GPP). (2010). 3GPP
TS 26.244 V 9.2.0: Technical Specification Group Services and System Aspects; Transparent end-to-end packet switched streaming service (PSS); 3GPP file format
(3GP) (Release 9). (Website) http://www.3gpp.org
2. 3rd Generation Partnership Project (3GPP). (2011). 3GPP
TS 26.090 V 10.1.0: Technical Specification Group Services and System Aspects; Mandatory Speech Codec
speech processing functions; Adaptive Multi-Rate (AMR)
speech codec; Transcoding functions (Release 10).
(Website) http://www.3gpp.org
3. audio engineering Society (aeS). (1996). AES recommended practice for forensic purposes – Managing
recorded audio materials intended for examination,
AES27–1996. audio engineering Society inc. (Website)
http://www.aes.org
4. Breeuwsma, M., De Jongh, M., klaver, c., Van Der
knijff, R., Roeloffs, M. (2007). Forensic data recovery
from flash memory. Small Scale Digital Device Forensics
Journal. (Website) http://www.mislan.com/SSDDFJ/
5. casey, e. (2010). Handbook of digital forensics and investigation. Burlington, San Diego, London: elsevier
academic Press.
Problems of Forensic Sciences 2016, vol. 105, 355–369
Test audio recordings and their use in authenticity examinations. Database of properties of digital audio recorders and...
6. casey, e., Turnbull, B. (2011). Digital evidence on mobile devices. (in) e. casey (ed.), Digital evidence and
computer crime (pp. 603–606). Baltimore: elsevier academic Press.
7. cooper, a. J. (2006). Detection of copies of digital audio
recordings for forensic purposes. (PhD Thesis). Faculty
of Technology, Department of information and communication Technology, The Open University.
8. Gloe, T., Fisher, a., kirchner, M. (2014). Forensic analysis of video file formats. Digital Investigation, 11, 68–76.
9. Grigoras, c. (2005). Digital audio recording analysis:
The electric network frequency (eNF) criterion. International Journal of Speech, Language and the Law, 12,
64–76.
10. Grigoras, c., cooper, a., Michałek, M. (2009). ENFSI
Forensic Speech and Audio Analysis Working Group –
Best practice guidelines for ENF analysis in forensic authentication of digital evidence, ReF. cODe: FSaaWGBPM-eNF-001. eNFSi FSaaWG. (Website) www.
enfsi.eu.
11. ho, a. T. S., Li, S. (2015). Handbook of digital forensics
of multimedia data and devices. chicago: John Wiley &
Sons.
12. hong, G., Yin, Z. (2013). Research on digital audio authenticity analysis. 2nd International Conference on Computer Science and electronics engineering (iccSee
2013), hangzhou, People’s Republic of china.
13. international Organization for Standardization and
international electrotechnical commission (1993).
ISO/IEC 11172-3: Coding of moving pictures and associated audio for digital storage media at up to about
1,5 Mbit/s – Part 3: Audio. (Website) www.iso.org.
14. kajstura, M., Trawińska, a., hebenstreit, J. (2005). application of the electrical network frequency (eNF) criterion. A case of a digital recording. Forensic Science
International, 155, 165–171.
15. kirn, P. (2007). Real world digital audio. Edycja polska.
Gliwice: Wydawnictwo helion.
16. koenig, B. e. (1990). authentication of forensic audio
recordings. Journal of Audio Engineering Society, 38,
3–33.
17. koenig, B. e., Lacey. D. S. (2012). authenticity analyses of the header data encoded WMa files from small
Olympus audio recorders. Journal of Audio Engineering
Society, 60, 255–265.
18. korbecki, M. (1999). Komputerowe przetwarzanie
dźwięku. Warszawa: Wydawnictwo MikOM.
19. korycki, R. (2011). analiza autentyczności cyfrowych
nagrań fonicznych. Problemy Kryminalistyki, 271, 5–21.
20. Microsoft corporation (1994). Microsoft multimedia
standards update, New multimedia data types and data
techniques, Revision 3.0.
21. Microsoft corporation (2010). Advanced Systems Format (ASF) specification, Revision 01.20.05.
363
22. Michałek, M. (2014). Database and parameters of digital audio test recordings. Paper presented at 16th eNFSi
Forensic Speech and audio analysis Working Group
Meeting, Wiesbaden, Germany.
23. Michałek, M. (2009). The application of powerline hum
in digital recording authenticity analysis. Problems of
Forensic Sciences, 80, 355–364.
24. Savage, T. M., Vogel, k. e. (2014). An introduction to
digital multimedia. Burlington: Jones and Barlett Learning.
25. Sztekmiler, k. (2003). Podstawy nagłośnienia i realizacji nagrań. Podręcznik dla akustyków. Warszawa: Narodowe centrum kultury.
Correspondingauthor
Dr inż. Marcin Michałek
instytut ekspertyz Sądowych
ul. Westerplatte 9
PL 31-033 kraków
e-mail: [email protected]
Problems of Forensic Sciences 2016, vol. 105, 355–369
Problems of Forensic Sciences 2016, vol. 105, 355–369
DźWiękoWEnAgRAniATEsToWEoRAZiChWykoRZysTAniE
WbADAniAChAuTEnTyCZnośCi.bAZADAnyChWłAśCiWośCi
CyfRoWyChREjEsTRAToRóWDźWiękuinAgRAń
1. Wstęp
Technika cyfrowego zapisu i edycji danych znalazła
zastosowanie w szczególności dla dokumentów multimedialnych (ho, Li, 2015; Savage, Vogel, 2014). aktualnie zaobserwować można coraz większą powszechność
i różnorodność cyfrowych urządzeń rejestrujących nagrania, nie tylko w postaci dedykowanych do tego celu
dyktafonów i kamer wideo, ale także innych urządzeń
powszechnego użytku, takich jak telefony komórkowe,
tablety, aparaty fotograficzne, odtwarzacze multimedialne oraz różnego rodzaju pamięci przenośne z funkcją nagrywania (ho, Li, 2015; Michałek, 2014). Jeszcze
kilka lat temu dowodowe nagrania analogowe stanowiły
zdecydowaną większość przy niewielkim udziale nagrań
cyfrowych. Obecnie, dzięki powszechności urządzeń cyfrowych, to ekspertyzy, w których analizowane są nagrania analogowe stanowią nieliczne przypadki. Doświadczenie eksperckie wskazuje, że dowodowe nagrania
cyfrowe w większości utrwalane są nie za pomocą wysokiej jakości profesjonalnych rejestratorów, ale urządzeń
powszechnego użytku, takich jak wymienione powyżej
(Michałek, 2014).
W związku z dużą liczbą marek i modeli rejestratorów istnieje obecnie wiele formatów zapisu dźwięku,
które odznaczaja się różnymi parametrami (casey, Turnbull, 2011; ho, Li, 2015; Urbański, 1989). W badaniach
fonoskopijnych najlepszym rozwiązaniem jest import nagrania do przestrzeni roboczej profesjonalnego oprogramowania przeznaczonego do odsłuchu i analizy nagrań.
Programy takie rozpoznają zwykle wiele powszechnych
formatów zapisu. Jednakże część producentów, nawet
tych dobrze znanych, stosuje w swoich rejestratorach
własne i często niestandardowe formaty zapisu nagrań,
które wymagają konwersji do formatu standardowego
w celu ich importu do oprogramowania analizującego.
Należy przy tym dysponować programem, który dokona
takiej konwersji, na przykład do postaci nieskompresowanej WaVe PcM.
Fakt akceptacji przez organa procesowe nagrań jako
materiału dowodowego, jak również zakres badań wskazywanych przez zleceniodawców, skutkuje koniecznością analizy ich autentyczności (cooper, 2006; Grigoras,
2005; hong, Yin, 2013; kajstura, Trawińska, hebenstreit, 2005; koenig, 1990; korycki, 2011; Michałek, 2009).
Podana przez audio engineering Society (aeS) definicja
autentyczności nagrania wskazuje na konieczność ustalenia jego ciągłości oraz oryginalności i związanej z tym
metody rejestracji (aeS, 1996). Powszechność sprzętu
i oprogramowań służących do cyfrowej edycji nagrań
stwarza szerokie możliwości ingerencji w ich treść (kirn,
2007; korbecki, 1999; Sztekmiler, 2003). Dlatego obecnie badania autentyczności nagrań cyfrowych wymagają
konkatenacji różnych metod fonoskopijnych, jak również
współudziału narzędzi z zakresu informatyki sądowej.
istotnym elementem w procesie badań autentyczności cyfrowego nagrania dowodowego są nagrania testowe wykonywane za pomocą urządzenia, które miało
służyć do jego rejestracji. Pozwalają one na przeprowadzenie analizy porównawczej ich parametrów i struktury plików względem zapisu z nagraniem dowodowym.
Umożliwiają także zweryfikowanie poprawności działania rejestratora, zbadanie jego właściwości oraz ustalenie, czy rzeczywiście mógł on być użyty do utrwalenia
dowodowego nagrania (cooper, 2006; hong, Yin, 2013;
koenig, Lacey, 2012).
Dostępne obecnie cyfrowe rejestratory umożliwiają
wybór parametrów zapisu nagrań, co skutkuje ich rejestracją w różnej jakości. Spora różnorodność marek
i modeli tych urządzeń oraz stosowanych formatów
zapisu wymusza podjęcie badań w tym kierunku. W niniejszej pracy opisano proces rejestracji dźwiękowych
nagrań testowych oraz analizę ich parametrów. Zostały one utrwalone za pomocą zgromadzonych urządzeń
z możliwością rejestracji nagrań oraz z wykorzystaniem
dostępnych ustawień i funkcji zapisu. Na tej podstawie
skonstruowano bazę zawierającą informacje o zbadanych urządzeniach i wykonanych nagraniach testowych
wraz z dostępem do oryginalnych plików dźwiękowych.
Zawarto w niej również wykaz programów umożliwiających konwersję nagrań do formatu standardowego
WaVe PcM. Skonstruowana baza danych stanowi narzędzie wspomagające eksperta w trakcie badań autentyczności cyfrowych nagrań dźwiękowych.
2. Znaczenienagrańtestowychiichrealizacja
Wykonując badania autentyczności nagrania, należy
zwrócić szczególną uwagę na etap związany z realizacją nagrań testowych. Wypowiedzenie się odnośnie do
tego, czy dowodowe nagranie mogło zostać poddane manipulacji, jest oryginalne i zostało utrwalone za pomocą
konkretnego rejestratora, to jedne z najczęstszych pytań
organów zlecających badania fonoskopijne. aby na nie
Dźwiękowe nagrania testowe oraz ich wykorzystanie w badaniach autentyczności. Baza danych właściwości cyfrowych...
odpowiedzieć, konieczne jest wykonanie analizy jego
autentyczności.
Zgromadzony w sprawie materiał dowodowy, oprócz
nagrania, może zawierać także rejestrator, który miał
być wykorzystany do wykonania zapisu. Jeżeli zleceniodawca nie przekazał takiego urządzenia, należy zwrócić
się do niego z prośbą o zabezpieczenie i przekazanie
go biegłemu do badań. Za pomocą takiego rejestratora
możliwe jest wykonanie nagrań testowych i przeprowadzenie porównawczej analizy: audytywnej, parametrów,
jak również charakterystyk wraz z ewentualnymi śladami wskazującymi na braki ciągłości zapisu względem
nagrania dowodowego. Możliwe jest przy tym ustalenie
metod kopiowania nagrań z i do pamięci przedmiotowego urządzenia. Ten etap badań pozwala również na
ustalenie, czy analizowane urządzenie jest sprawne technicznie i umożliwia utrwalanie nagrań. Przed rozpoczęciem badań rejestratora i wykonaniem nagrań testowych
weryfikuje się jego aktualne ustawienia, w tym także
wskazania czasu zegara, oraz zabezpiecza dane z pamięci poprzez wykonanie kopii jej zawartości. Umożliwia
to porównanie zawartości pamięci rejestratora po zakończeniu badań w odniesieniu do stanu sprzed rozpoczęcia
analizy. Jeżeli urządzenie na to pozwala, wykonuje się
tzw. obraz zawartości pamięci oraz oblicza sumy kontrolne, na przykład algorytmem MD5, zarówno dla fizycznego obszaru obrazowanej pamięci urządzenia oraz,
w celu weryfikacji, także dla jej obrazu. Ma to na celu
zabezpieczenie pamięci nośnika w takim stanie, w jakim
został on przekazany do badań, co ma istotne znaczenie
dla wyników i wniosków wysnutych na tej podstawie
(Breeuwsma, De Jongh, klaver, Van Der knijff, Roeloffs, 2007; casey, 2010).
Przed przystąpieniem do realizacji nagrań testowych
konieczna jest dokładna analiza audytywna oraz parametrów i charakterystyk nagrania dowodowego w celu
ustalenia, jakie dźwięki i w jakich warunkach akustycznych zostały zarejestrowane. Należy również zapoznać
się z możliwościami rejestracji, funkcjami urządzenia
nagrywającego i opcjami zasilania, analizując instrukcję
obsługi i dostępne menu oraz oceniając stan techniczny.
Umożliwi to opracowanie planu wykonania nagrań testowych zawierającego opis ich realizacji, kolejność nagrań
i sekwencji odtwarzanych dźwięków oraz zastosowanych parametrów i funkcji. Jest on niezbędny zarówno
do wykonania i archiwizacji tych czynności, jak i do
późniejszej analizy nagrań. Dobrą i sprawdzoną praktyką w trakcie realizacji każdego nagrania testowego jest
słowny opis: daty i godziny początku oraz końca nagrania, miejsca rejestracji i aktualnych warunków akustycznych, marki i modelu urządzenia, zasilania, parametrów
zapisu i stosowanych funkcji oraz kolejno utrwalanych
sygnałów.
W trakcie rejestracji nagrań testowych w pomieszczeniach izolowanych akustycznie generowane są sy-
365
gnały o określonym uprzednio czasie trwania i zakresach
częstotliwościowych, takich jak tony podstawowe i szumy, utrwalana jest również mowa oraz celowe zakłócenia. Jeśli jest to istotne dla wyników badań i możliwe
do realizacji, nagrania testowe powinny zostać utrwalone w miejscu rejestracji zdarzenia lub w warunkach
akustycznych do nich zbliżonych i zawierać dźwięki
odpowiadające tym z analizowanego nagrania. Nagrania
testowe należy utrwalać z wykorzystaniem dostępnych
funkcji i parametrów rejestracji danego urządzenia; dodatkowo, w celu wzajemnej weryfikacji, z kilkukrotnym
powtórzeniem dla każdego ustawienia. Umożliwi to pełną analizę charakterystyk czasowych i częstotliwościowych tych nagrań oraz ewentualne charakterystyczne
ślady powstałe w wyniku użycia funkcji pauzy, automatycznego wstrzymywania nagrywania lub montażu,
które powodują braki ciągłości zapisu. Nagrania testowe
pozwalają ustalić, czy urządzenie umożliwia rejestrację
przydźwięku sieciowego oraz ujawnić ewentualne inne
charakterystyczne cechy, takie jak generowanie sygnałów o stałych lub zmiennych parametrach czasowo-częstotliwościowych i składowej stałej (cooper, 2006; Grigoras, cooper, Michałek, 2009; kajstura, Trawińska, hebenstreit, 2005; korycki, 2011; Michałek, 2009). Jeżeli
w nagraniu dowodowym utrwalono sygnalizację DTMF,
zakłócenia wynikające z pracy telefonów komórkowych
i inne sygnały, które mają standardowe parametry czasowe i częstotliwościowe, w celu weryfikacji tych parametrów można je również zarejestrować w nagraniach
testowych.
W ramach badań autentyczności nagrań cyfrowych
wykonuje się również analizę struktury plików dźwiękowych. Pliki takie zawierają tzw. metadane, które opisują właściwe dane z zakodowanym dźwiękiem (Gloe,
Fisher, kirchner, 2014; hong, Yin, 2013; koenig, Lacey,
2012). analizę taką przeprowadza się z wykorzystaniem
oprogramowań umożliwiających wizualizację i edycję
plików w postaci kodu szesnastkowego.
Metadane znajdujące się w obrębie plików dźwiękowych zawierają istotne informacje z punktu widzenia
analizy ich autentyczności. W szczególności w obrębie
tzw. nagłówka, znajdującego się na początku struktury
danych, odnaleźć można format zapisu i parametry pliku multimedialnego. Dodatkowo w nagłówku zapisane mogą być: data i godzina rejestracji nagrania, czas
trwania nagrania, marka i model urządzenia, wielkość
pliku i rozmiar jego części z zakodowanym dźwiękiem.
Metadane zapisywane są również w obrębie tzw. tagów,
przykładowo w tagach iD3 stosowanych w popularnym
formacie zapisu MP3. W wyniku edycji pliku z nagraniem za pomocą oprogramowań przeznaczonych do tego
celu bardzo często powstają wpisy w strukturze pliku, na
przykład w formacie XML lub XMP. Takie dodatkowe
metadane, jak wskazuje praktyka, zapisywane są przeważnie w końcowej części struktury danych edytowane-
Problems of Forensic Sciences 2016, vol. 105, 355–369
366
M. Michałek
go pliku. Należy dodać, że aktualnie istnieje wiele różnych formatów zapisu nagrań, przy czym każdy z nich
ma zwykle inną strukturę. Wykonanie nagrań testowych
stwarza możliwość analizy porównawczej ich struktury
danych ze strukturą pliku dowodowego.
Mogłoby się wydawać, że wykonanie nagrań testowych w odniesieniu do pozostałych badań fonoskopijnych jest stosunkowo proste w realizacji i polega głównie
na włączeniu rejestracji, utrwaleniu żądanych dźwięków
i wyłączeniu nagrywania. Jednakże, wbrew pozorom,
jest to zadanie skomplikowane i czasochłonne. Wymaga
ono nie tylko szczegółowej analizy nagrania dowodowego oraz wstępnego przygotowania urządzenia i planowanych czynności, ale także rejestracji nagrań zgodnie
z zaplanowanym harmonogramem, ich skopiowanie oraz
późniejszą żmudną analizę porównawczą względem niekiedy wielu nagrań dowodowych.
Już niedrogie i proste w obsłudze cyfrowe rejestratory dźwięku oferują możliwość zmiany jakości zapisu,
często jednak z wstępnie zaprogramowanymi ustawieniami producenta. Urządzenia bardziej zaawansowane
umożliwiają zmianę takich parametrów, jak liczba kanałów, częstotliwość próbkowania, rozdzielczość bitowa,
rejestracja w postaci skompresowanej lub bez kompresji
oraz format zapisu. Dodatkowo posiadają wbudowany
zegar z możliwością jego ustawienia, wyposażone są
w funkcje pauzy lub automatycznego wstrzymywania
i aktywacji nagrywania poziomem głośności, filtrację
szumów, umożliwiają nawet edycję nagrań poprzez usuwanie fragmentów lub ich montaż. Powyższe skutkuje
dużą liczbą możliwych kombinacji ustawień podczas
rejestracji, co przekłada się na liczbę nagrań testowych.
W tabeli 1 zaprezentowano zestawienie możliwych do
zmiany parametrów i funkcji dla dwóch przykładowych
rejestratorów dźwięku powszechnego użytku oraz wynikającą z tego liczbę kombinacji ustawień nagrywania dla
dwukrotnego powtórzenia każdego ustawienia. Dodatkowe funkcje lub parametry odpowiednio zwielokrotniają
liczbę kombinacji ustawień.
3. Materiałdobadań
3.1. Rejestratory cyfrowe
W celu wykonania badań zgromadzono i przeanalizowano blisko 120 urządzeń dostępnych powszechnie
i wyposażonych w funkcję cyfrowej rejestracji dźwięku,
takich jak dyktafony, telefony komórkowe, odtwarzacze
multimedialne z funkcją nagrywania, tablety i kamery wideo. Do badań wykorzystano urządzenia następujących
marek: apple, BlackBerry, creative, hTc, JVc, LG,
Marantz, Nokia, Olympus, Panasonic, Pentagram, Philips, Roland, Samsung, Siemens, Sony, Tascam, Toshiba,
Track i Zoom. Nagrania testowe utrwalano w pamięciach
wbudowanych w rejestratory oraz wymiennych, zarówno typu flash, jak i w postaci dysków MiniDisc.
Przed przystąpieniem do nagrań testowych zapoznawano się szczegółowo ze zgromadzoną dokumentacją
techniczną każdego urządzenia, analizowano jego możliwości rejestracji i stan techniczny oraz wykonywano
dokumentację fotograficzną.
3.2. cyfrowe nagrania dźwiękowe
Za pomocą zgromadzonych urządzeń utrwalono ponad 720 cyfrowych nagrań dźwiękowych w 18 różnych
formatach zapisu. Po utrwaleniu w pamięci rejestratora
każde z nagrań testowych zostało skopiowane na dysk
twardy komputera laboratoryjnego celem dalszej analizy
lub wykonano obraz zawartości pamięci urządzenia.
Nagrania testowe wykonano z wszystkimi możliwymi ustawieniami zapisu badanych urządzeń oraz z wykorzystaniem dostępnych funkcji, takich jak uruchomienie i zakończenie nagrywania, funkcja pauzy, aktywacja
nagrywania poziomem głośności, indeksowanie, filtracja
szumów tła, jak również ewentualna edycja nagrań. Nagrania testowe zrealizowane zostały w różnych warunkach akustycznych, utrwalając możliwie szeroki zakres
dźwięków. W izolowanych akustycznie pomieszczeniach, za pomocą stanowiska komputerowego wyposażonego w monitory odsłuchowe oraz słuchawki, odtwarzano i rejestrowano: szumy o szerokim paśmie częstotliwościowym, tony w zakresie niskich, średnich i wysokich
częstotliwości, zakłócenia o charakterze impulsowym
i ciągłym, jak również wypowiedzi. Za pomocą badanych rejestratorów utrwalano także dźwięki na otwartej
przestrzeni, które związane były z ruchem ulicznym, jak
również wewnątrz poruszających się pojazdów. W opisanych powyżej warunkach akustycznych rejestrowano też
wypowiedzi w stałych i zmiennych odległościach względem mikrofonów urządzeń nagrywających.
4. Analizawłaściwościbadanychurządzeń
inagrańtestowych
Wykonanie nagrań testowych umożliwiło analizę
właściwości przebadanych urządzeń. Jak zaznaczono,
w ramach badań zgromadzono i przeanalizowano blisko 120 rejestratorów umożliwiających cyfrowy zapis
dźwięku. W tabeli 2 przedstawiono wyniki analizy właściwości urządzeń wykorzystanych do rejestracji nagrań
testowych, która zawiera zestawienie marek zgromadzonych rejestratorów, ich rodzajów, liczby formatów, możliwości zmiany jakości zapisu dla dostępnych formatów
oraz rejestracji plików dźwiękowych bez kompresji lub
z kompresją zapisu.
Za pomocą zgromadzonych rejestratorów utrwalono nagrania testowe w 18 różnych formatach zapisu, tj.:
Problems of Forensic Sciences 2016, vol. 105, 355–369
Dźwiękowe nagrania testowe oraz ich wykorzystanie w badaniach autentyczności. Baza danych właściwości cyfrowych...
3GP, aiFF, aMR, BWF, DSS, M4a, MP2, MP3, MOD,
OMa, OMG, PVc, WaVe aDPcM, WaVe PcM, VM1,
VY2 (VY4), VYF i WMa. W tabeli 3 przedstawiono
procentowy udział najczęściej występujących formatów
w odniesieniu do ogólnej liczby wykonanych nagrań.
Przeprowadzona analiza wykazała, że nagrania testowe zarejestrowane zostały w zdecydowanej większości
za pomocą dyktafonów cyfrowych i w trzech dominujących formatach zapisu, tj. WaVe aDPcM, WMa i MP3.
Większość badanych urządzeń umożliwiała rejestrację
tylko w jednym formacie zapisu, jednak spora ich część
pozwalała na wybór między dwoma, a nawet trzema różnymi formatami. W przypadku możliwości zapisu przez
rejestrator w więcej niż dwóch formatach najczęściej
spotykanymi były: WMa i MP3 (stosujące kompresję)
oraz WaVe PcM (bez kompresji zapisu). Pojedyncze
urządzenia spośród analizowanych umożliwiały zapis
w większej liczbie formatów niż trzy i były to głównie
zaawansowane technicznie rejestratory dźwięku. Przykładem takiego urządzenia jest Marantz PMD671, który
umożliwia zapis dźwięku w czterech różnych formatach,
w tym w dwóch nieskompresowanych, tj. WaVe PcM
i BWF. Z przeprowadzonej analizy wynika również, że
większość badanych urządzeń dla konkretnego formatu
pozwala na wybór jakości zapisu i zmianę parametrów.
Do tej grupy zaliczyć można głównie dyktafony z zapisem w formatach WMa, MP3 i WaVe PcM. Z kolei urządzenia rejestrujące w formacie aMR, tj. przede
wszystkim telefony komórkowe, jak również niektóre
dyktafony i odtwarzacze z funkcją nagrywania w formacie WaVe aDPcM, nie umożliwiały zmiany parametrów zapisu, a tym samym wyboru jakości.
Ustalono, że parametry wszystkich zarejestrowanych nagrań testowych zawierały się w następujących
granicach: rozdzielczość 4–24 bitów na próbkę, częstotliwość próbkowania 8–96 khz, przepływność bitowa
5–2304 kbps oraz zakres pasma częstotliwościowego
w przybliżeniu 3,8–40 khz. Małe wartości odpowiadają
nagraniom o niskiej jakości z wąskim pasmem częstotliwościowym i zarejestrowanych za pomocą algorytmów
odznaczających się silną kompresją. Z kolei wartości
duże charakteryzują nagrania o wysokiej jakości z szerokim pasmem częstotliwościowym i utrwalonych głównie
w formacie nieskompresowanym WaVe PcM.
Wszystkie badane rejestratory umożliwiały wykonanie kopii plików z nagraniami na dysk twardy komputera
z wykorzystaniem złącza cyfrowego. część z nich, głównie starsze modele, pozwalały na transfer plików z nagraniami jedynie za pomocą dedykowanego oprogramowania producenta instalowanego w systemie operacyjnym
komputera. Przykładowo, dyktafony Olympus i modele
serii VN wykorzystują program Digital Wave Player,
z kolei rejestratory Sony zapisujące na wymiennych nośnikach typu MiniDisc, tak jak model MZ-Nh900, wymagają instalacji programu SonicStage. Pozostałe reje-
367
stratory pozwalały na bezpośrednią kopię plików z ich
pamięci na dysk twardy celem dalszej analizy. Na tej
podstawie ustalono, że każdy z badanych rejestratorów
automatycznie nadawał nazwy plikom z nagraniami według ustalonego schematu. Przykładowe nazwy plików
dźwiękowych dla konkretnych modeli urządzeń przedstawiono poniżej. Nazwy tych plików wskazują na:
– model rejestratora i kolejny numer nagrania: DS500001.WMa, WS650001.MP3 albo
801_0182 MP3 (marka Olympus i modele, odpowiednio, DS-50, WS-650S, WS-801), DR-100_0001.WaV
(Tascam DR-100), R09_0001.WaV (Roland eDiROL
R-09);
– transfer za pomocą dedykowanego oprogramowania,
oznaczenie folderu zapisu w pamięci urządzenia i numer nagrania: DW_a0001.WaV (oprogramowanie
Digital Wave Player, folder a; nazewnictwo to stosowane jest w przypadku rejestratorów Olympus i modeli takich, jak VN-120Pc, VN-1100Pc, VN-2000Pc,
VN-2100Pc i VN-3100Pc);
– datę albo datę i godzinę rejestracji: VN-2016021600001.amr (BlackBerry 9320), recording-20130809121814.MP3 (Pentagram Tab 7.5), 001-2009-10-08
11_49_40.oma (Sony MZ-Nh900); część nazwy pliku zawierająca wskazanie czasu zależy od ustawień
zegara wbudowanego w urządzenie;
– numer nagrania: 1001.WaV (Marantz PMD671).
Odnotowano również nazwy składające się z następujących oznaczeń: audio, Głos, Mic, MOB, Nagr,
Nagranie, Plik audio, Rec, Sound clip, Voice albo VOc
wraz z następującym po nim kolejnym numerem nagrania w pamięci urządzenia; takie nazwy plików z nagraniami cechują przede wszystkim telefony komórkowe
oraz odtwarzacze z funkcją nagrywania.
Pliki dźwiękowe z nagraniami testowymi w każdym
analizowanym formacie zapisu posiadają bardziej lub
mniej rozbudowane metadane z informacjami dotyczącymi: marki i modelu rejestratora, właściwości zapisu,
daty, godziny i czasu trwania nagrania lub ilości danych
w pliku. Jak zaznaczono wyżej, istotne informacje zawarte są również w nazwach utrwalanych plików.
Na rysunku 1 zwizualizowano w postaci heksadecymalnej (z lewej) i kodu aScii (z prawej) fragment
struktury danych w pliku z nagraniem w formacie WaVe
aDPcM, czyli takim, który odnotowano najczęściej
wśród nagrań testowych. Na rysunku zaznaczono obszar nagłówka pliku, który zawiera metadane z wpisami
wskazującymi na liczbę danych w pliku (00 10 8e 34
bajtów w systemie szesnastkowym, zapis w postaci Little endian), format (WaVe aDPcM, kodek iMa, kod 00
11), podstawowe parametry zapisu (1 kanał, częstotliwość próbkowania 22 050 hz, przepływność 88,8 kbps,
rozdzielczość 4 bity na każdą próbkę) oraz liczbę danych
z zakodowanym dźwiękiem (00 10 8e 00 bajtów).
Problems of Forensic Sciences 2016, vol. 105, 355–369
368
M. Michałek
Na szczególną uwagę zasługują pliki dźwiękowe
utrwalane za pomocą rejestratorów marki Olympus, które zawierają łatwe do zdekodowania wpisy wskazujące
na markę i model urządzenia, datę i godzinę początku
oraz końca rejestracji nagrania, czas trwania nagrania
i jego numer oraz parametry zapisu dźwięku. Dane takie
zapisywane są przez większość modeli wskazanej marki.
Na rysunku 2 przedstawiono dwa fragmenty struktury danych pliku dźwiękowego zapisanego za pomocą
rejestratora Olympus WS-650S w drugim co do częstości występowania formacie wśród nagrań testowych,
tj. WMa. Pierwszy fragment struktury (na rysunku
w części a) zawiera zaznaczone metadane z wpisami
wskazującymi na markę rejestratora (Olympus), model
(WS650S), datę oraz godzinę początku i końca rejestracji (2010.01.04 od 16:50:58 do 17:43:57) oraz czas trwania nagrania (00:52:59). Z kolei w drugim fragmencie
(w części b) zaznaczono parametry zapisu nagrania, tj.
format (WMa), przepływność (32 kbps), częstotliwość
próbkowania (44 khz) i liczbę kanałów (1).
Programy do automatycznej analizy plików multimedialnych podają niekiedy tylko niektóre parametry ich
zapisu lub wartości te są niedokładne, zdarza się też, że
w ogóle nie rozpoznają danego formatu. Wtedy głównym źródłem informacji o takim pliku jest analiza jego
struktury danych w edytorze szesnastkowym, którą pokrótce opisano wyżej.
5. bazadanychwłaściwościcyfrowych
rejestratorówdźwiękuinagrańoraz
możliwościichkonwersjidoformatu
WaVe pcm
W ramach wykonanych prac wszystkie rejestratory,
za pomocą których utrwalono nagrania testowe, zostały
jednolicie skatalogowane. W katalogu głównym każdego
z nich znajdują się pogrupowane informacje dotyczące
dokumentacji technicznej i fotograficznej, oprogramowania do konwersji z formatu źródłowego do standardowego i nieskompresowanego WaVe PcM oraz nagrania
testowe w formacie źródłowym i przekonwertowane do
WaVe PcM.
Zbiór skatalogowanych i usystematyzowanych informacji stanowił podstawę do skonstruowania relacyjnej bazy danych w oprogramowaniu Microsoft access
wraz z interfejsem użytkownika. Przedmiotowa baza
dla każdego zbadanego urządzenia zawiera następujące
informacje: rodzaj urządzenia, opis marki i modelu, dokumentację, wskazanie możliwości rejestracji (audio lub
wideo), wykaz dostępnych formatów zapisu i rozszerzeń
plików dźwiękowych, opis podstawowych parametrów
nagrań, dostęp do katalogu z plikami w źródłowych formatach zapisu i przekonwertowanych oraz do katalogu
z programami do konwersji nagrań do formatu WaVe
PcM. Fragment widoku tabeli głównej wykonanej bazy
danych przedstawiono na rysunku 3.
Zamieszczenie w bazie danych plików z nagraniami
w źródłowym formacie umożliwia wykonanie analizy
porównawczej ich parametrów zarówno pomiędzy takimi samymi modelami danej marki, jak i analizowanymi nagraniami dowodowymi. Zgromadzenie w jednym
miejscu usystematyzowanych danych o cyfrowych rejestratorach dźwięku oraz o parametrach ich nagrań i programach do konwersji umożliwia szybki dostęp do istotnych informacji w trakcie badań fonoskopijnych i znacznie oszczędza czas. Otwarta struktura skonstruowanej
bazy pozwala na jej uzupełnianie o kolejne informacje
i nagrania.
Zwykle istnieje możliwość odtworzenia zarejestrowanego nagrania za pomocą urządzenia, którym zostało
ono zarejestrowane, jednakże w trakcie badań fonoskopijnych wykorzystuje się profesjonalne oprogramowania
komputerowe służące do odtwarzania i analizy nagrań.
Zdarza się też, że zgromadzony materiał do badań nie
zawiera urządzenia, którym zarejestrowano nagranie
będące przedmiotem analizy. W związku z tym przeanalizowano możliwość odtwarzania utrwalonych nagrań
testowych w ich formatach źródłowych oraz konwersję
do formatu standardowego i nieskompresowanego, tj.
WaVe PcM, za pomocą programów komputerowych.
Odtworzenie w źródłowym formacie daje często możliwość wstępnej oceny nagrania i ustalenie utrwalonych
w nim treści. Z kolei konwersja do postaci WaVe PcM
umożliwia import nagrania do przestrzeni roboczej profesjonalnych programów w celu wykonania badań odsłuchowych i spisania treści, analizy charakterystyk czasowych i częstotliwościowych w trakcie badań autentyczności, jak również parametrów sygnału mowy podczas
badaniach identyfikacyjnych mówców.
Popularne obecnie formaty zapisu nagrań, takie jak
WaVe PcM i aDMcP, MPeG-1 i MPeG-2 audio Layer iii (MP3), WMa, 3GP lub aMR są dobrze znane
i udokumentowane (3GPP, 2010; 3GPP, 2011; iSO/iec,
1992; Microsoft corp., 1994, Microsoft corp., 2010).
Dostępnych jest również wiele użytecznych narzędzi pozwalających na ich analizę oraz odtwarzanie i konwersję
do formatu nieskompresowanego WaVe PcM. Jednak
niektórzy producenci cyfrowych rejestratorów dźwięku
stosują własne i niestandardowe formaty zapisu z bardzo
ubogą lub w ogóle pozbawione ogólnodostępnej dokumentacji. Problematyczne staje się wówczas odtworzenie takiego nagrania oraz wykonanie jego konwersji do
formatu WaVe PcM w celu analizy w odpowiednim
oprogramowaniu. Może również okazać się, że analiza
struktury danych plików z takimi nagraniami i zdekodowanie metadanych możliwe jest jedynie w ograniczonym
zakresie.
Wśród darmowych programów, które umożliwiają
odtworzenie lub konwersję większości standardowych
Problems of Forensic Sciences 2016, vol. 105, 355–369
Dźwiękowe nagrania testowe oraz ich wykorzystanie w badaniach autentyczności. Baza danych właściwości cyfrowych...
formatów zapisu do WaVe PcM, wyróżnić można następujące: Pazera Free audio extractor obsługiwany
z linii poleceń ffmpeg i powiązany z nim ffplay, Mobile
Media converter oraz VLc media player. Podczas badań wykorzystano również profesjonalne oprogramowanie adobe audition. Wymienione programy umożliwiły
przekonwertowanie zarejestrowanych nagrań testowych
z następujących formatów: WaVe aDPcM, WMa,
aMR, MP3, MP2, 3GP, M4a, aiFF, MOD i BWF do
postaci nieskompresowanej WaVe PcM.
Dla nagrań testowych utrwalonych w mało popularnych formatach do ich odtworzenia i konwersji do
formatu WaVe PcM niezbędne było wykorzystanie
dedykowanych programów producenta konkretnego
rejestratora. Zgromadzone nagrania testowe w plikach
dźwiękowe o rozszerzeniach: VM1, PVc, DSS, VY2
(VY4), VYF oraz OMa i OMG mogą zostać odtworzone oraz przekonwertowane za pomocą oprogramowań,
odpowiednio: Voice editing, Voice editing Mini Player
i Voice editing, DSS Player Lite i DSS Player v.7, Voice
yepp Player i WaV_converter, Samsung Voice Manager
oraz SonicStage.
369
Podziękowania
Opisane w niniejszym artukule prace zostały wykonane
w ramach projektu badawczego nr X/k zrealizowanego
w instytucie ekspertyz Sądowych im. Prof. dra Jana Sehna w krakowie.
6. podsumowanie
W pracy opisano znaczenie i wykorzystanie dźwiękowych nagrań testowych do celów badania autentyczności
nagrań dowodowych. Przedstawiono właściwości przebadanych urządzeń z funkcją rejestracji dźwięku i parametry utrwalonych za ich pomocą nagrań testowych,
a także skonstruowaną na tej podstawie bazę danych.
Zebrany i usystematyzowany zbiór danych pozwala na
szybką weryfikację parametrów konkretnego modelu rejestratora i jego nagrań, jak również ustalenie oprogramowania do konwersji z formatu źródłowego do PcM
WaVe, co umożliwia dalszą analizę nagrań. Otwarta
struktura skonstruowanego zbioru pozwala na jego aktualizowanie i uzupełnianie o nowe dane wraz z analizą
kolejnych modeli urządzeń umożliwiających rejestrację
nagrań.
Wyniki przeprowadzonych badań i przedmiotowa
baza danych są wykorzystywane w bieżącej działalności
opiniodawczej jako narzędzie wpomagające w badaniach
autentyczności nagrań. Należy dodać, że tworzony zbiór
informacji o cyfrowych urządzeniach rejestrujących i ich
nagraniach z całą pewnością może być być pomocny do
badań nie tylko z zakresu fonoskopii, ale także w obszarach pokrewnych, na przykład w informatyce sądowej.
Stanowi również dostateczny materiał do przeprowadzenia innych badań z zakresy analizy nagrań dźwiękowych.
Problems of Forensic Sciences 2016, vol. 105, 355–369