Pobierz PDF - PROBLEMS OF FORENSIC SCIENCES
Transkrypt
Pobierz PDF - PROBLEMS OF FORENSIC SCIENCES
Problems of Forensic Sciences 2016, vol. 105, 355–369 TesT audio recordings and Their use in auThenTiciTy examinaTions. daTabase of properTies of digiTal audio recorders and recordings Marcin Michałek Institute of Forensic Research, Kraków, Poland summary currently, there are many brands and models of devices with a digital audio recording function and with different recording parameters. at present, experts almost exclusively receive digital devices and recordings stored using digital technology for forensic audio examination – these have almost entirely replaced analogue techniques in the field of multimedia. The aim of this study was to collect devices with a digital audio recording function, and then make test recordings with these devices and determine the possibility of converting them into a standard format. a database containing the parameters of the analysed recorders and their recordings was created as part of this study. The test recordings were made in available recording formats for each recorder and under different acoustic conditions. it was determined that the largest groups of analysed recorders was voice recorders (75%), followed by mobile phones (19%) and other devices with an audio recording function, such as multimedia players, tablets and cameras (6% in total). The test recordings were made in 18 different recording formats, which were characterized by different quality and parameters. The most numerous formats were: WaVe aDPcM, WMa and MP3. The conducted research and results, as well as the constructed database, are helpful for experts investigating the authenticity of audio recordings. Key words authentic recording; Database; Digital recorder; Test recording. Received 20 June 2016; accepted 29 September 2016 1. introduction The technique of digital recording and editing of data has been applied in particular to multimedia documents (ho, Li, 2015; Savage, Vogel, 2014). currently, the prevalence and diversity of digital devices with a recording capacity is increasing – not only voice recorders and video cameras dedicated to this purpose, but also other generally used devices, such as mobile phones, tablets, cameras, multimedia players and various types of flash drives (memory sticks) with a recording function (ho, Li, 2015; Michałek, 2014). Just a few years ago, evidentiary analogue recordings constituted the clear majority among evidentiary recordings, with just a small proportion of digital recordings. Now, thanks to the prevalence of digital devices, expert reports concerning analysis of analogue recordings are rare. expert practice indicates that evidentiary digital recordings are mostly made not with high quality professional equipment, but rather with widely used consumer devices, such as those mentioned above (Michałek, 2014). Due to the large number of brands and models of recorders, there are currently many audio recording formats, which are distinguished by various parameters (casey, Turnbull, 2011; ho, Li, 2015; Urbański, 1989). in forensic audio analysis, the best solution is to import a recording into the working space of professional programmes designed for listening to and analysing recordings. Such programmes usually rec- 356 M. Michałek ognise many common recording formats. However, some producers, even well-known, use their own, often non-standard, recording formats in their own recorders, which require conversion to standard format for the purpose of importing them into analysing software. Therefore, it is important to have a programme which will make such a conversion, for example into the form of uncompressed WaVe PcM. The fact of acceptance of recordings as evidence material by a judicial body and also the range of requested analyses results in the necessity of evaluating their authenticity (cooper, 2006; Grigoras, 2005; hong, Yin, 2013; kajstura, Trawińska, hebenstreit, 2005; koenig, 1990; korycki, 2011; Michałek, 2009). The definition of the authenticity of a recording given by the audio engineering Society (aeS) indicates the necessity of establishing its continuity and originality and hence the method of recording (aeS, 1996). The prevalence of equipment and software used for digital editing of recordings has created broad possibilities of interfering in their content (kirn, 2007; korbecki, 1999; Sztekmiler, 2003). That is why currently authentications of digital recordings require a combination of various forensic audio methods, as well as the co-participation of tools from the field of forensic informatics. an important element in the process of authenticating a digital recording is making test recordings with the help of the device that is believed to have been used to make the digital recording. These test recordings allow you to carry out a comparative analysis of their parameters and file structure in relation to the evidentiary recording. They also enable you to verify whether the recorder is working correctly, to study its properties and to establish whether it could really have been used to make the evidentiary recording (cooper, 2006; hong, Yin, 2013; koenig, Lacey, 2012). Digital recorders that are currently generally available enable you to choose recording parameters, resulting in recordings of varying quality. The wide variety of brands and models of these devices and of the formats of recordings has compelled us to undertake research in this field. in this paper, the process of making test audio recordings and analysing their parameters has been described. The test recordings were made using the collected recording devices, making use of the range of available settings and recording functions. On this basis, a database has been constructed containing information about the studied recording devices and the recorded test recordings, together with access to original audio files. The database also contains a list of programmes enabling conversion of recordings to the standard format – WaVe PcM. The constructed database constitutes a tool that can aid experts in the authentication of digital audio recordings. 2. Thesignificanceandmakingoftest recordings When carrying out an authentication of a recording, special attention should be paid to the stage linked with making test recordings. Could an evidential recording have been tampered with? is it original? Was it recorded using a particular recorder? – these are among the most frequent questions posed by judicial bodies and related to forensic audio analysis. In order to answer them, it is necessary to carry out an analysis of the recording’s authenticity. The evidential material collected in the case may include – apart from the recording – the recorder which is believed to have been used to make the recording. if the judicial body has not provided the given recording device, the expert should request that it be secured and submitted to him/her for examination. The recorder can be used to make test recordings and carry out a comparative auditory analysis as well as an analysis of the parameters and characteristics – and also of possible traces indicating discontinuity – in relation to the evidential recording. In this way it is possible to establish methods of copying recordings from and to the memory of the device in question. This stage of testing also allows you to establish whether the analysed device is working properly and can record. Before the expert starts to study the recorder and make test recordings, its current settings must be verified – including the date and time – and data must be secured from the memory by making copies of its contents. This enables a comparison of the content of the memory of the recorder after finishing the analysis with the state before beginning analysis. If the device allows it the expert should make a so-called memory image as well as calculate checksums, for example with an MD5 algorithm, both for the physical area of the imaged memory of the device, and – for the purpose of verification – for its image. This is aimed at securing the memory of the data carrier in the state in which it was submitted for analysis, which has great significance for results and conclusions drawn on this basis (Breeuwsma, De Jongh, klaver, Van Der knijff, Roeloffs, 2007; casey, 2010). Before making test recordings, it is necessary to carry out a thorough auditory analysis as well as an analysis of parameters and characteristics of the evidential recording for the purpose of establishing what sounds were recorded and in what acoustic conditions. Problems of Forensic Sciences 2016, vol. 105, 355–369 Test audio recordings and their use in authenticity examinations. Database of properties of digital audio recorders and... The expert should also familiarize with the recording possibilities, the functions of the recording device and the power supply options, by analysing the operating manual and the available menu as well as by assessing the technical state. This will enable you to draw up a plan for making test recordings, containing a description of their execution, the sequence of recordings and the sequence of played back sounds as well as the applied parameters and functions. a plan is necessary both for carrying out and archiving these activities and for later analysis of recordings. A good, tried and tested practice in the course of making each of the test recording is to create a written description: the date and time of the beginning and the end of the recording, the place of recording and current acoustic conditions, the brand and model of the device, power supply, parameters of the recording and applied functions as well as successively recorded signals. In the course of making test recordings in acoustically isolated rooms, signals of previously defined duration and frequency ranges, such as basic tones and noises are generated, and speech and intentional interferences are also recorded. if it is significant for the results of analyses and possible to carry out, the test recordings should be made in the place where the event was recorded or in acoustic conditions that are similar to them and contain sounds corresponding to those from the analysed recording. Test recordings should be made using the available functions and recording parameters of the given device; additionally, recordings should be repeated several times for each setting, for the purpose of mutual verification. This will allow complete analysis of time and frequency characteristics of these recordings as well as possible characteristic traces that have arisen as a result of using the pause function, automatic stopping of the recording or editing, which cause interruptions in the continuity of the recording. Test recordings allow you to determine whether the device enables recording of the hum signal, and to reveal other possible characteristic features, such as generation of signals of constant or variable time-frequency parameters and the Dc offset (cooper, 2006; Grigoras, cooper, Michałek, 2009; kajstura, Trawińska, hebenstreit, 2005; korycki, 2011; Michałek, 2009). if the DTMF signal – as well as interferences resulting from mobile phone use and other signals that have standard time and frequency parameters – have been recorded on the evidentiary recording, then these parameters can also be recorded on test recordings in order to verify them. analysis of the structure of audio files is also carried out as part of authenticity investigations of digital recordings. Such files contain so-called metada- 357 ta, which describe relevant data with encoded sound (Gloe, Fisher, kirchner, 2014; hong, Yin, 2013; koenig, Lacey, 2012). Such an analysis is carried out using software enabling visualisation and editing of files in the form of hexadecimal code. Metadata in audio files contain information that is significant for authentication investigations. in particular, the format of a recording and the parameters of a multi-media file can be found within the so-called header, situated at the beginning of a block of data. additionally, the following can be saved in the header: the date and time of the recording, the duration of the recording, the brand and model of the device, the size of the file and the size of the part containing the encoded sound. Metadata are also stored within so-called tags, for example in iD3 tags applied in the popular MP3 audio file format. as a result of editing an audio file using programmes designed for this purpose, very often entries arise in the file structure, for example in XML or XMP format. Such additional metadata, as practice shows, are usually saved in the end part of the data structure of the edited file. it should be added that currently many different audio formats exist and each of them usually has a different structure. Making test recordings creates an opportunity for comparative analysis of the data structure of the test recordings with the structure of the evidential file. It might seem that making test recordings is relatively simple – consisting basically in switching on the recording function, recording the desired sounds, and then turning off the recording function – in comparison to other forensic audio analyses. However, contrary to appearances, it is a complicated and time-consuming task. The expert needs to carry out a detailed analysis of the evidentiary recording and preliminarily prepares the recording device and planned actions as well as makes the recordings in accordance with a planned schedule, copy them, and later carry out a laborious comparative analysis in relation to – sometimes numerous – evidentiary recordings. Digital audio recorders – which are affordable and easy-to-use nowadays – offer the possibility of changing the quality of a recording, although they often have manufacturer’s pre-defined settings. More advanced recorders enable a change in such parameters, for example: number of channels, sampling rate, bit resolution, recording in compressed or uncompressed format, and audio format. In addition, they have a builtin clock which can be set, are equipped with a pause function or voice-activated recording, noise filtering, and they even enable editing of recordings by removing fragments or combining them. The above results in a large number of possible combinations of settings Problems of Forensic Sciences 2016, vol. 105, 355–369 358 M. Michałek during recording, which is reflected in the number of test recordings. Table 1 presents parameters and functions that can be changed in two typical generally available audio recorders, and the resultant number of combinations of recording settings for double repetition of each setting. additional functions or parameters increase the number of combinations of settings. Table 1 Settable parameters and functions and the number of their combinations for two different audio recorders Recording parameters and functions Recorder 1 Recorder 2 Audio format WaVe aDPcM MP3 WMa Number of quality settings 2 2 6 Continuous recording Yes Yes Pause function None Manual and automatic Number of combinations of settings 2 6 18 Number of recordings with double repetition of each setting 4 12 36 3. research material 3.1. Digital recorders in order to perform the research, nearly 120 commonly available devices with a digital audio recording function, such as voice recorders, mobile phones, multi-media players with a recording function, tablets and video cameras were collected and analysed. The following brands of devices were studied in the present research: apple, BlackBerry, creative, hTc, JVc, LG, Marantz, Nokia, Olympus, Panasonic, Pentagram, Philips, Roland, Samsung, Siemens, Sony, Tascam, Toshiba, Track and Zoom. Test recordings were saved on internal and removable memories, both flash and MiniDisc. Before making the test recordings, the operating manual, recording capabilities and technical state was studied carefully and the photographic documentation was made for every device. 3.2. Digital sound recordings Using the collected devices, over 720 digital audio recordings were saved in 18 different audio formats. After saving in the memory of the recorder, each of the test recordings was copied onto the hard disk of the laboratory computer for further analysis or an image was made of the content of the memory of the device. Test recordings were made using all possible recording settings of the studied devices as well as available functions such as start and stop of recording, pause function, voice-activated recording, indexing, filtering background noise, as well as possible editing of recordings. Test recordings were made in various acoustic conditions, recording the broadest possible range of sounds. In acoustically isolated rooms, using a computer work station equipped with monitor speakers and headphones, the following were generated and recorded: wide-frequency noise, tones in low, medium and high frequency ranges, pulsed and continuous interference, and speech. Using the examined recorders, sounds in open space associated with street traffic were also recorded as well as sounds inside moving vehicles. Speech at constant and changing distances from the microphones of the recording devices were also recorded in the acoustic conditions described above. 4. Analysisofthepropertiesofthetested devices and test recordings Conducting test recordings enabled analysis of the properties of the studied devices. as mentioned, as part of the research, nearly 120 devices with a digital audio recording function were collected and analysed. Table 2 presents the results of analysis of the properties of the devices used to make the test recordings. The table contains the following information: the brands of the collected recorders, their types, numbers of formats, capability of changing the quality of recording for available formats and saving of audio files as uncompressed or compressed files. Using the collected recording devices, test recordings were made in 18 different recording formats, i.e.,: 3GP, aiFF, aMR, BWF, DSS, M4a, MP2, MP3, MOD, OMa, OMG, PVc, WaVe aDPcM, WaVe PcM, VM1, VY2 (VY4), VYF and WMa. Table 3 shows the percentage share of the most frequently occurring formats in relation to the general number of recordings. The performed analysis showed that a significant majority of test recordings were conducted using digital voice recorders and in three dominant recording formats, i.e., WaVe aDPcM, WMa and MP3. Most of the studied devices recorded in only one file format, but a considerable number of them allowed a choice between two or even three different formats. in the Problems of Forensic Sciences 2016, vol. 105, 355–369 359 Test audio recordings and their use in authenticity examinations. Database of properties of digital audio recorders and... Table 2 Properties of digital devices used to make audio test recordings Brand Olympus (58%) Sony (8%) Nokia, Tascam, Samsung (each 5%) Others (19%) Type Voice recorder (75%) Mobile phone (19%) Multimedia player (3%) Tablet, video camera (3%) Number of audio formats One (59%) Two (25%) Three (15%) More than three (1%) Quality setting Yes (87%) No (23%) compression Uncompressed and compressed audio files (32%) Only compressed audio files (68%) Table 3 The proportion of most frequent audio file formats (as a percentage of all test recordings) Audio format Proportion [%] WaVe aDPcM WMa MP3 AMR WaVe PcM 3GP M4a Others 42 26 10 7 5 3 2 5 event of a recorder being able to record in more than two formats, the most frequently encountered were: WMa and MP3 (using compression) and WaVe PcM (uncompressed). individual devices amongst those analysed enabled recording in more than three formats – these devices were mainly technically advanced audio recorders. an example of such a device is the Marantz PMD671, which lets you record audio in four different formats, including two uncompressed ones, i.e., WaVe PcM and BWF. From the conducted analysis it also transpires that most of the studied devices allow you to choose the recording quality and change parameters for a specific format. This group mainly includes voice recorders with recording in WMa, MP3 and WaVe PcM formats. in turn, devices recording in aMR format, i.e., mainly cellular phones, as well as certain voice recorders and media players with a recording function in the WaVe aDPcM format, do not allow to change recording parameters and thus to choose quality. it was established that the parameters of all conducted test recordings lay within the following ranges: resolution 4–24 bits per sample, sampling rate 8–96 khz, bit rate 5–2304 kbps and frequency band range approximately 3.8–40 khz. Low values correspond to recordings of low quality with a narrow frequency band, recorded with the help of algorithms characterised by strong compression. in turn, high values are characteristic of recordings of high quality with a broad frequency band, recorded mainly in WaVe PcM uncompressed format. all the tested recorders allow to copy files containing recordings onto the hard disk of a computer using a digital connector. Some of them, especially older models, only allow to transfer files containing recordings using dedicated manufacturer’s software installed in the operating system of the computer. For example, Olympus voice recorders and models in the VN series use Digital Wave Player, whilst Sony recorders, when saving on removable media carriers such as MiniDisc, for example model MZ-Nh900, require installation of SonicStage. The other recorders allow to directly copy files from their memory onto a hard disk for the purpose of further analysis. On this basis, it was established that each of the studied recorders automatically gave names to audio files (containing recordings) according to an established scheme. example names of sound files for specific device models are presented below. The names of these files indicate: – the recorder model and the successive number of the recording, for example: DS500001.WMa, WS650001.MP3 or 801_0182.MP3 (Olympus models: DS-50, WS-650S, and WS-801 respectively), DR-100_0001.WaV (Tascam DR-100), and R09_0001.WaV (Roland eDiROL R-09); – transfer using dedicated software, labelling the folder of the saved recording in the memory of the device and the recording number: DW_a0001.WaV (Digital Wave Player software, folder a; this naming system is used in the case of Olympus recorders and models such as VN-120Pc, VN-1100Pc, VN2000Pc, VN-2100Pc and VN-3100Pc); Problems of Forensic Sciences 2016, vol. 105, 355–369 360 M. Michałek – date or date and time of recording: VN20160216-00001.amr (BlackBerry 9320), recording-20130809-121814.MP3 (Pentagram Tab 7.5), 001-2009-10-08 11_49_40.oma (Sony MZNh900); the part of the file name indicating the time depends on the built-in clock settings in the device; – number of the recording: 1001.WaV (Marantz PMD671); – the following names have also been noted: audio, Głos, Mic, MOB, Nagr, Nagranie, Plik audio, Rec, Sound clip, Voice or VOc together with the successive recording number in the memory of the device; such names of audio files are characteristic, above all, for cellular phones and media players with a recording function. audio files containing test recordings in each analysed recording format possess metadata – of greater or lesser extensiveness – concerning: the brand and model of the recorder, the recording properties, the date, time and duration of the recording or amount of data in the file. as noted above, important information is also included in the names of the saved files. in Figure 1, a fragment of data structure in an audio file in the WaVe aDPcM format – the type of format noted most frequently among test recordings – has been visualised in the form of hexadecimal (on the left) and aScii code (on the right). The region of the file header which contains metadata with entries indicating the number of data in the file (00 10 8e 34 bytes in hexadecimal notation, in little-endian order), format (WaVe aDPcM, codec iMa, code 00 11), basic parameters of the recording (1 channel, sampling rate 22 050 hz, bit rate 88.8 kbps, resolution 4 bits per sample) and number of data with encoded audio (00 10 8e 00 bytes) has been marked in the figure. audio files recorded by Olympus recorders are particularly noteworthy, containing easy to decode entries indicating the brand and model of the device, the date and the time of the beginning and end of the recording, the duration of the recording and its number, and the parameters of the audio recording. Such data are recorded by most Olympus models. Figure 2 shows two fragments of data structure of an audio file recorded using an Olympus WS-650S recorder in the second most common format among test recordings, i.e., WMa. The first part of the structure (Fig 2a) contains metadata indicating the brand of the recorder (Olympus), model (WS650S), date and time of the beginning and end of the recording (2010.01.04, from 16:50:58 to 17:43:57) and recording time (00:52:59). in turn, in the second part (Figure 2b), the parameters of the recording are indicated, i.e., format (WMa), bit rate (32 kbps), sampling rate (44 khz) and the number of channels (1). Programmes for automatic analysis of multimedia files sometimes only give some parameters of the recording, or sometimes these values may be inaccurate; it may also happen that they do not recognise a given format at all. Then the main source of information about such a file is analysis of its data structure using a hex editor, which has been briefly described above. 5. Databaseofpropertiesofdigitalsound recorders and recordings as well as possibilitiesoftheirconversionto WAVEPCMformat as part of the work carried out, all recorders used for making test recordings were systematically catalogued. The following information is stored in the main catalogue for each recorder: information relating to technical and photographic documentation, software for conversion from source format to standard and uncompressed WaVe PcM format, as well as the test recordings themselves in source format and converted to WaVe PcM format. The collection of catalogued and structured information constituted the basis for constructing a relational database in Microsoft Access together with a user interface. This database contains the following information for each studied device: the type of device, a description of the make and model, documentation, the of type of recording (audio or video), a list of available audio file recording formats and extensions, Fig. 1. The file header of a recording stored in WaVe aDPcM audio file format. Problems of Forensic Sciences 2016, vol. 105, 355–369 Test audio recordings and their use in authenticity examinations. Database of properties of digital audio recorders and... 361 a) b) Fig. 2. information and parameters of a recording stored in WMa audio file format by Olympus recorder. Fig. 3. View of the main table of the constructed database containing information about analysed recorders and test recordings. a description of basic recording parameters, access to the catalogue with files in source formats and converted formats as well as to the catalogue with programmes for conversion of recordings to WaVe PcM format. A fragment of the view of the main table of the created database is presented in Figure 3. inputting audio files containing recordings in their source format into the database enables to perform a comparative analysis of parameters between recordings made using the same models of a given brand (make) and also between analysed evidentiary recordings. Collecting together structured data about digital sound recorders and about parameters of their recordings and programmes for conversion in one place enables quick access to significant information when carrying out forensic audio analysis and saves a signif- icant amount of time. having a database with an open structure enables to update it with further information and recordings. it is usually possible to play back a recording using the device on which it was recorded; however, in the course of forensic audio analysis, professional computer software serving to play and analyse recordings is used. Sometimes the material collected for analysis does not include the device on which the recording in question was made. Therefore it was analysed the possibility of playing back saved test recordings in their source formats and converting to standard and uncompressed format, i.e., WaVe PcM, using computer programmes. Playing back in the source format often gives you the possibility of preliminarily assessing the recording and establishing the recorded content. In Problems of Forensic Sciences 2016, vol. 105, 355–369 362 M. Michałek turn, conversion to WaVe PcM format allows you to import the recording into the working space of professional programmes for the purpose of performing auditory analysis and making a transcription, analysing time and frequency characteristics in the course of authenticity analyses, as well as parameters of the speech signal during speaker identification studies. currently popular recording formats, such as WaVe PcM and aDMcP, MPeG-1 and MPeG-2 audio Layer iii (MP3), WMa, 3GP or aMR are wellknown and documented (3GPP, 2010; 3GPP, 2011; iSO/iec, 1992; Microsoft corp., 1994, Microsoft corp., 2010). Many useful tools allowing their analysis and playback, and conversion to uncompressed WaVe PcM are available. however, some producers of digital audio recorders use their own, non-standard recording formats accompanied by very poor documentation or even no generally available documentation. Playing back such a recording and converting it to the WaVe PcM format for the purpose of analysis in appropriate software is thus problematic. it may also turn out that analysis of the data structure of files containing such recordings and decoding of metadata is only possible to a limited extent. among free programmes which enable to play back or convert most standard formats of recording to WaVe PcM, the following can be distinguished: Pazera Free audio extractor, operated from the command-line ffmpeg and ffplay, Mobile Media converter and VLc media player. During the study, adobe audition professional software was also used. The mentioned programmes enabled conversion of test recordings from the following formats: WaVe aDPcM, WMa, aMR, MP3, MP2, 3GP, M4a, aiFF, MOD and BWF to the uncompressed WaVe PcM format. For test recordings saved in less popular formats, it was essential to use dedicated software by the manufacturer of the given recorder to play them back and convert them to WaVe PcM format. The collected test recordings in sound files with the extensions: VM1, PVc, DSS, VY2 (VY4), and VYF as well as OMa and OMG can be played back and converted using software, respectively: Voice editing, Voice editing Mini Player and Voice editing, DSS Player Lite and DSS Player v.7, Voice yepp Player and WaV_converter, Samsung Voice Manager and SonicStage. 6. summary The paper describes the significance and use of audio test recordings in the authentication of evidential recordings. it has been presented the properties of devices with a sound recording function and the parameters of test recordings made on them, as well as a database constructed on this basis. The structured collection of data enables to quickly verify the parameters of a specific model of a recorder and its recordings, as well as determine the necessary software for conversion from source format to PcM WaVe, which enables further analysis of recordings. The open structure of the constructed collection allows you to update it and supplement it with new data as you analyse successive recording devices. The results of the performed analyses and the mentioned database are used in current expert witnessing practice as aids in the authentication of recordings. it should be added that the created collection of information on digital recording devices and their recordings can certainly be helpful in investigations not only in the field of audio forensics, but also in related fields, for example, forensic informatics. The database also provides adequate material for carrying out other analyses of audio recordings. Acknowledgements The research work described in this article was carried out under research project no. X/k at the institute of Forensic Research in kraków. References 1. 3rd Generation Partnership Project (3GPP). (2010). 3GPP TS 26.244 V 9.2.0: Technical Specification Group Services and System Aspects; Transparent end-to-end packet switched streaming service (PSS); 3GPP file format (3GP) (Release 9). (Website) http://www.3gpp.org 2. 3rd Generation Partnership Project (3GPP). (2011). 3GPP TS 26.090 V 10.1.0: Technical Specification Group Services and System Aspects; Mandatory Speech Codec speech processing functions; Adaptive Multi-Rate (AMR) speech codec; Transcoding functions (Release 10). (Website) http://www.3gpp.org 3. audio engineering Society (aeS). (1996). AES recommended practice for forensic purposes – Managing recorded audio materials intended for examination, AES27–1996. audio engineering Society inc. (Website) http://www.aes.org 4. Breeuwsma, M., De Jongh, M., klaver, c., Van Der knijff, R., Roeloffs, M. (2007). Forensic data recovery from flash memory. Small Scale Digital Device Forensics Journal. (Website) http://www.mislan.com/SSDDFJ/ 5. casey, e. (2010). Handbook of digital forensics and investigation. Burlington, San Diego, London: elsevier academic Press. Problems of Forensic Sciences 2016, vol. 105, 355–369 Test audio recordings and their use in authenticity examinations. Database of properties of digital audio recorders and... 6. casey, e., Turnbull, B. (2011). Digital evidence on mobile devices. (in) e. casey (ed.), Digital evidence and computer crime (pp. 603–606). Baltimore: elsevier academic Press. 7. cooper, a. J. (2006). Detection of copies of digital audio recordings for forensic purposes. (PhD Thesis). Faculty of Technology, Department of information and communication Technology, The Open University. 8. Gloe, T., Fisher, a., kirchner, M. (2014). Forensic analysis of video file formats. Digital Investigation, 11, 68–76. 9. Grigoras, c. (2005). Digital audio recording analysis: The electric network frequency (eNF) criterion. International Journal of Speech, Language and the Law, 12, 64–76. 10. Grigoras, c., cooper, a., Michałek, M. (2009). ENFSI Forensic Speech and Audio Analysis Working Group – Best practice guidelines for ENF analysis in forensic authentication of digital evidence, ReF. cODe: FSaaWGBPM-eNF-001. eNFSi FSaaWG. (Website) www. enfsi.eu. 11. ho, a. T. S., Li, S. (2015). Handbook of digital forensics of multimedia data and devices. chicago: John Wiley & Sons. 12. hong, G., Yin, Z. (2013). Research on digital audio authenticity analysis. 2nd International Conference on Computer Science and electronics engineering (iccSee 2013), hangzhou, People’s Republic of china. 13. international Organization for Standardization and international electrotechnical commission (1993). ISO/IEC 11172-3: Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s – Part 3: Audio. (Website) www.iso.org. 14. kajstura, M., Trawińska, a., hebenstreit, J. (2005). application of the electrical network frequency (eNF) criterion. A case of a digital recording. Forensic Science International, 155, 165–171. 15. kirn, P. (2007). Real world digital audio. Edycja polska. Gliwice: Wydawnictwo helion. 16. koenig, B. e. (1990). authentication of forensic audio recordings. Journal of Audio Engineering Society, 38, 3–33. 17. koenig, B. e., Lacey. D. S. (2012). authenticity analyses of the header data encoded WMa files from small Olympus audio recorders. Journal of Audio Engineering Society, 60, 255–265. 18. korbecki, M. (1999). Komputerowe przetwarzanie dźwięku. Warszawa: Wydawnictwo MikOM. 19. korycki, R. (2011). analiza autentyczności cyfrowych nagrań fonicznych. Problemy Kryminalistyki, 271, 5–21. 20. Microsoft corporation (1994). Microsoft multimedia standards update, New multimedia data types and data techniques, Revision 3.0. 21. Microsoft corporation (2010). Advanced Systems Format (ASF) specification, Revision 01.20.05. 363 22. Michałek, M. (2014). Database and parameters of digital audio test recordings. Paper presented at 16th eNFSi Forensic Speech and audio analysis Working Group Meeting, Wiesbaden, Germany. 23. Michałek, M. (2009). The application of powerline hum in digital recording authenticity analysis. Problems of Forensic Sciences, 80, 355–364. 24. Savage, T. M., Vogel, k. e. (2014). An introduction to digital multimedia. Burlington: Jones and Barlett Learning. 25. Sztekmiler, k. (2003). Podstawy nagłośnienia i realizacji nagrań. Podręcznik dla akustyków. Warszawa: Narodowe centrum kultury. Correspondingauthor Dr inż. Marcin Michałek instytut ekspertyz Sądowych ul. Westerplatte 9 PL 31-033 kraków e-mail: [email protected] Problems of Forensic Sciences 2016, vol. 105, 355–369 Problems of Forensic Sciences 2016, vol. 105, 355–369 DźWiękoWEnAgRAniATEsToWEoRAZiChWykoRZysTAniE WbADAniAChAuTEnTyCZnośCi.bAZADAnyChWłAśCiWośCi CyfRoWyChREjEsTRAToRóWDźWiękuinAgRAń 1. Wstęp Technika cyfrowego zapisu i edycji danych znalazła zastosowanie w szczególności dla dokumentów multimedialnych (ho, Li, 2015; Savage, Vogel, 2014). aktualnie zaobserwować można coraz większą powszechność i różnorodność cyfrowych urządzeń rejestrujących nagrania, nie tylko w postaci dedykowanych do tego celu dyktafonów i kamer wideo, ale także innych urządzeń powszechnego użytku, takich jak telefony komórkowe, tablety, aparaty fotograficzne, odtwarzacze multimedialne oraz różnego rodzaju pamięci przenośne z funkcją nagrywania (ho, Li, 2015; Michałek, 2014). Jeszcze kilka lat temu dowodowe nagrania analogowe stanowiły zdecydowaną większość przy niewielkim udziale nagrań cyfrowych. Obecnie, dzięki powszechności urządzeń cyfrowych, to ekspertyzy, w których analizowane są nagrania analogowe stanowią nieliczne przypadki. Doświadczenie eksperckie wskazuje, że dowodowe nagrania cyfrowe w większości utrwalane są nie za pomocą wysokiej jakości profesjonalnych rejestratorów, ale urządzeń powszechnego użytku, takich jak wymienione powyżej (Michałek, 2014). W związku z dużą liczbą marek i modeli rejestratorów istnieje obecnie wiele formatów zapisu dźwięku, które odznaczaja się różnymi parametrami (casey, Turnbull, 2011; ho, Li, 2015; Urbański, 1989). W badaniach fonoskopijnych najlepszym rozwiązaniem jest import nagrania do przestrzeni roboczej profesjonalnego oprogramowania przeznaczonego do odsłuchu i analizy nagrań. Programy takie rozpoznają zwykle wiele powszechnych formatów zapisu. Jednakże część producentów, nawet tych dobrze znanych, stosuje w swoich rejestratorach własne i często niestandardowe formaty zapisu nagrań, które wymagają konwersji do formatu standardowego w celu ich importu do oprogramowania analizującego. Należy przy tym dysponować programem, który dokona takiej konwersji, na przykład do postaci nieskompresowanej WaVe PcM. Fakt akceptacji przez organa procesowe nagrań jako materiału dowodowego, jak również zakres badań wskazywanych przez zleceniodawców, skutkuje koniecznością analizy ich autentyczności (cooper, 2006; Grigoras, 2005; hong, Yin, 2013; kajstura, Trawińska, hebenstreit, 2005; koenig, 1990; korycki, 2011; Michałek, 2009). Podana przez audio engineering Society (aeS) definicja autentyczności nagrania wskazuje na konieczność ustalenia jego ciągłości oraz oryginalności i związanej z tym metody rejestracji (aeS, 1996). Powszechność sprzętu i oprogramowań służących do cyfrowej edycji nagrań stwarza szerokie możliwości ingerencji w ich treść (kirn, 2007; korbecki, 1999; Sztekmiler, 2003). Dlatego obecnie badania autentyczności nagrań cyfrowych wymagają konkatenacji różnych metod fonoskopijnych, jak również współudziału narzędzi z zakresu informatyki sądowej. istotnym elementem w procesie badań autentyczności cyfrowego nagrania dowodowego są nagrania testowe wykonywane za pomocą urządzenia, które miało służyć do jego rejestracji. Pozwalają one na przeprowadzenie analizy porównawczej ich parametrów i struktury plików względem zapisu z nagraniem dowodowym. Umożliwiają także zweryfikowanie poprawności działania rejestratora, zbadanie jego właściwości oraz ustalenie, czy rzeczywiście mógł on być użyty do utrwalenia dowodowego nagrania (cooper, 2006; hong, Yin, 2013; koenig, Lacey, 2012). Dostępne obecnie cyfrowe rejestratory umożliwiają wybór parametrów zapisu nagrań, co skutkuje ich rejestracją w różnej jakości. Spora różnorodność marek i modeli tych urządzeń oraz stosowanych formatów zapisu wymusza podjęcie badań w tym kierunku. W niniejszej pracy opisano proces rejestracji dźwiękowych nagrań testowych oraz analizę ich parametrów. Zostały one utrwalone za pomocą zgromadzonych urządzeń z możliwością rejestracji nagrań oraz z wykorzystaniem dostępnych ustawień i funkcji zapisu. Na tej podstawie skonstruowano bazę zawierającą informacje o zbadanych urządzeniach i wykonanych nagraniach testowych wraz z dostępem do oryginalnych plików dźwiękowych. Zawarto w niej również wykaz programów umożliwiających konwersję nagrań do formatu standardowego WaVe PcM. Skonstruowana baza danych stanowi narzędzie wspomagające eksperta w trakcie badań autentyczności cyfrowych nagrań dźwiękowych. 2. Znaczenienagrańtestowychiichrealizacja Wykonując badania autentyczności nagrania, należy zwrócić szczególną uwagę na etap związany z realizacją nagrań testowych. Wypowiedzenie się odnośnie do tego, czy dowodowe nagranie mogło zostać poddane manipulacji, jest oryginalne i zostało utrwalone za pomocą konkretnego rejestratora, to jedne z najczęstszych pytań organów zlecających badania fonoskopijne. aby na nie Dźwiękowe nagrania testowe oraz ich wykorzystanie w badaniach autentyczności. Baza danych właściwości cyfrowych... odpowiedzieć, konieczne jest wykonanie analizy jego autentyczności. Zgromadzony w sprawie materiał dowodowy, oprócz nagrania, może zawierać także rejestrator, który miał być wykorzystany do wykonania zapisu. Jeżeli zleceniodawca nie przekazał takiego urządzenia, należy zwrócić się do niego z prośbą o zabezpieczenie i przekazanie go biegłemu do badań. Za pomocą takiego rejestratora możliwe jest wykonanie nagrań testowych i przeprowadzenie porównawczej analizy: audytywnej, parametrów, jak również charakterystyk wraz z ewentualnymi śladami wskazującymi na braki ciągłości zapisu względem nagrania dowodowego. Możliwe jest przy tym ustalenie metod kopiowania nagrań z i do pamięci przedmiotowego urządzenia. Ten etap badań pozwala również na ustalenie, czy analizowane urządzenie jest sprawne technicznie i umożliwia utrwalanie nagrań. Przed rozpoczęciem badań rejestratora i wykonaniem nagrań testowych weryfikuje się jego aktualne ustawienia, w tym także wskazania czasu zegara, oraz zabezpiecza dane z pamięci poprzez wykonanie kopii jej zawartości. Umożliwia to porównanie zawartości pamięci rejestratora po zakończeniu badań w odniesieniu do stanu sprzed rozpoczęcia analizy. Jeżeli urządzenie na to pozwala, wykonuje się tzw. obraz zawartości pamięci oraz oblicza sumy kontrolne, na przykład algorytmem MD5, zarówno dla fizycznego obszaru obrazowanej pamięci urządzenia oraz, w celu weryfikacji, także dla jej obrazu. Ma to na celu zabezpieczenie pamięci nośnika w takim stanie, w jakim został on przekazany do badań, co ma istotne znaczenie dla wyników i wniosków wysnutych na tej podstawie (Breeuwsma, De Jongh, klaver, Van Der knijff, Roeloffs, 2007; casey, 2010). Przed przystąpieniem do realizacji nagrań testowych konieczna jest dokładna analiza audytywna oraz parametrów i charakterystyk nagrania dowodowego w celu ustalenia, jakie dźwięki i w jakich warunkach akustycznych zostały zarejestrowane. Należy również zapoznać się z możliwościami rejestracji, funkcjami urządzenia nagrywającego i opcjami zasilania, analizując instrukcję obsługi i dostępne menu oraz oceniając stan techniczny. Umożliwi to opracowanie planu wykonania nagrań testowych zawierającego opis ich realizacji, kolejność nagrań i sekwencji odtwarzanych dźwięków oraz zastosowanych parametrów i funkcji. Jest on niezbędny zarówno do wykonania i archiwizacji tych czynności, jak i do późniejszej analizy nagrań. Dobrą i sprawdzoną praktyką w trakcie realizacji każdego nagrania testowego jest słowny opis: daty i godziny początku oraz końca nagrania, miejsca rejestracji i aktualnych warunków akustycznych, marki i modelu urządzenia, zasilania, parametrów zapisu i stosowanych funkcji oraz kolejno utrwalanych sygnałów. W trakcie rejestracji nagrań testowych w pomieszczeniach izolowanych akustycznie generowane są sy- 365 gnały o określonym uprzednio czasie trwania i zakresach częstotliwościowych, takich jak tony podstawowe i szumy, utrwalana jest również mowa oraz celowe zakłócenia. Jeśli jest to istotne dla wyników badań i możliwe do realizacji, nagrania testowe powinny zostać utrwalone w miejscu rejestracji zdarzenia lub w warunkach akustycznych do nich zbliżonych i zawierać dźwięki odpowiadające tym z analizowanego nagrania. Nagrania testowe należy utrwalać z wykorzystaniem dostępnych funkcji i parametrów rejestracji danego urządzenia; dodatkowo, w celu wzajemnej weryfikacji, z kilkukrotnym powtórzeniem dla każdego ustawienia. Umożliwi to pełną analizę charakterystyk czasowych i częstotliwościowych tych nagrań oraz ewentualne charakterystyczne ślady powstałe w wyniku użycia funkcji pauzy, automatycznego wstrzymywania nagrywania lub montażu, które powodują braki ciągłości zapisu. Nagrania testowe pozwalają ustalić, czy urządzenie umożliwia rejestrację przydźwięku sieciowego oraz ujawnić ewentualne inne charakterystyczne cechy, takie jak generowanie sygnałów o stałych lub zmiennych parametrach czasowo-częstotliwościowych i składowej stałej (cooper, 2006; Grigoras, cooper, Michałek, 2009; kajstura, Trawińska, hebenstreit, 2005; korycki, 2011; Michałek, 2009). Jeżeli w nagraniu dowodowym utrwalono sygnalizację DTMF, zakłócenia wynikające z pracy telefonów komórkowych i inne sygnały, które mają standardowe parametry czasowe i częstotliwościowe, w celu weryfikacji tych parametrów można je również zarejestrować w nagraniach testowych. W ramach badań autentyczności nagrań cyfrowych wykonuje się również analizę struktury plików dźwiękowych. Pliki takie zawierają tzw. metadane, które opisują właściwe dane z zakodowanym dźwiękiem (Gloe, Fisher, kirchner, 2014; hong, Yin, 2013; koenig, Lacey, 2012). analizę taką przeprowadza się z wykorzystaniem oprogramowań umożliwiających wizualizację i edycję plików w postaci kodu szesnastkowego. Metadane znajdujące się w obrębie plików dźwiękowych zawierają istotne informacje z punktu widzenia analizy ich autentyczności. W szczególności w obrębie tzw. nagłówka, znajdującego się na początku struktury danych, odnaleźć można format zapisu i parametry pliku multimedialnego. Dodatkowo w nagłówku zapisane mogą być: data i godzina rejestracji nagrania, czas trwania nagrania, marka i model urządzenia, wielkość pliku i rozmiar jego części z zakodowanym dźwiękiem. Metadane zapisywane są również w obrębie tzw. tagów, przykładowo w tagach iD3 stosowanych w popularnym formacie zapisu MP3. W wyniku edycji pliku z nagraniem za pomocą oprogramowań przeznaczonych do tego celu bardzo często powstają wpisy w strukturze pliku, na przykład w formacie XML lub XMP. Takie dodatkowe metadane, jak wskazuje praktyka, zapisywane są przeważnie w końcowej części struktury danych edytowane- Problems of Forensic Sciences 2016, vol. 105, 355–369 366 M. Michałek go pliku. Należy dodać, że aktualnie istnieje wiele różnych formatów zapisu nagrań, przy czym każdy z nich ma zwykle inną strukturę. Wykonanie nagrań testowych stwarza możliwość analizy porównawczej ich struktury danych ze strukturą pliku dowodowego. Mogłoby się wydawać, że wykonanie nagrań testowych w odniesieniu do pozostałych badań fonoskopijnych jest stosunkowo proste w realizacji i polega głównie na włączeniu rejestracji, utrwaleniu żądanych dźwięków i wyłączeniu nagrywania. Jednakże, wbrew pozorom, jest to zadanie skomplikowane i czasochłonne. Wymaga ono nie tylko szczegółowej analizy nagrania dowodowego oraz wstępnego przygotowania urządzenia i planowanych czynności, ale także rejestracji nagrań zgodnie z zaplanowanym harmonogramem, ich skopiowanie oraz późniejszą żmudną analizę porównawczą względem niekiedy wielu nagrań dowodowych. Już niedrogie i proste w obsłudze cyfrowe rejestratory dźwięku oferują możliwość zmiany jakości zapisu, często jednak z wstępnie zaprogramowanymi ustawieniami producenta. Urządzenia bardziej zaawansowane umożliwiają zmianę takich parametrów, jak liczba kanałów, częstotliwość próbkowania, rozdzielczość bitowa, rejestracja w postaci skompresowanej lub bez kompresji oraz format zapisu. Dodatkowo posiadają wbudowany zegar z możliwością jego ustawienia, wyposażone są w funkcje pauzy lub automatycznego wstrzymywania i aktywacji nagrywania poziomem głośności, filtrację szumów, umożliwiają nawet edycję nagrań poprzez usuwanie fragmentów lub ich montaż. Powyższe skutkuje dużą liczbą możliwych kombinacji ustawień podczas rejestracji, co przekłada się na liczbę nagrań testowych. W tabeli 1 zaprezentowano zestawienie możliwych do zmiany parametrów i funkcji dla dwóch przykładowych rejestratorów dźwięku powszechnego użytku oraz wynikającą z tego liczbę kombinacji ustawień nagrywania dla dwukrotnego powtórzenia każdego ustawienia. Dodatkowe funkcje lub parametry odpowiednio zwielokrotniają liczbę kombinacji ustawień. 3. Materiałdobadań 3.1. Rejestratory cyfrowe W celu wykonania badań zgromadzono i przeanalizowano blisko 120 urządzeń dostępnych powszechnie i wyposażonych w funkcję cyfrowej rejestracji dźwięku, takich jak dyktafony, telefony komórkowe, odtwarzacze multimedialne z funkcją nagrywania, tablety i kamery wideo. Do badań wykorzystano urządzenia następujących marek: apple, BlackBerry, creative, hTc, JVc, LG, Marantz, Nokia, Olympus, Panasonic, Pentagram, Philips, Roland, Samsung, Siemens, Sony, Tascam, Toshiba, Track i Zoom. Nagrania testowe utrwalano w pamięciach wbudowanych w rejestratory oraz wymiennych, zarówno typu flash, jak i w postaci dysków MiniDisc. Przed przystąpieniem do nagrań testowych zapoznawano się szczegółowo ze zgromadzoną dokumentacją techniczną każdego urządzenia, analizowano jego możliwości rejestracji i stan techniczny oraz wykonywano dokumentację fotograficzną. 3.2. cyfrowe nagrania dźwiękowe Za pomocą zgromadzonych urządzeń utrwalono ponad 720 cyfrowych nagrań dźwiękowych w 18 różnych formatach zapisu. Po utrwaleniu w pamięci rejestratora każde z nagrań testowych zostało skopiowane na dysk twardy komputera laboratoryjnego celem dalszej analizy lub wykonano obraz zawartości pamięci urządzenia. Nagrania testowe wykonano z wszystkimi możliwymi ustawieniami zapisu badanych urządzeń oraz z wykorzystaniem dostępnych funkcji, takich jak uruchomienie i zakończenie nagrywania, funkcja pauzy, aktywacja nagrywania poziomem głośności, indeksowanie, filtracja szumów tła, jak również ewentualna edycja nagrań. Nagrania testowe zrealizowane zostały w różnych warunkach akustycznych, utrwalając możliwie szeroki zakres dźwięków. W izolowanych akustycznie pomieszczeniach, za pomocą stanowiska komputerowego wyposażonego w monitory odsłuchowe oraz słuchawki, odtwarzano i rejestrowano: szumy o szerokim paśmie częstotliwościowym, tony w zakresie niskich, średnich i wysokich częstotliwości, zakłócenia o charakterze impulsowym i ciągłym, jak również wypowiedzi. Za pomocą badanych rejestratorów utrwalano także dźwięki na otwartej przestrzeni, które związane były z ruchem ulicznym, jak również wewnątrz poruszających się pojazdów. W opisanych powyżej warunkach akustycznych rejestrowano też wypowiedzi w stałych i zmiennych odległościach względem mikrofonów urządzeń nagrywających. 4. Analizawłaściwościbadanychurządzeń inagrańtestowych Wykonanie nagrań testowych umożliwiło analizę właściwości przebadanych urządzeń. Jak zaznaczono, w ramach badań zgromadzono i przeanalizowano blisko 120 rejestratorów umożliwiających cyfrowy zapis dźwięku. W tabeli 2 przedstawiono wyniki analizy właściwości urządzeń wykorzystanych do rejestracji nagrań testowych, która zawiera zestawienie marek zgromadzonych rejestratorów, ich rodzajów, liczby formatów, możliwości zmiany jakości zapisu dla dostępnych formatów oraz rejestracji plików dźwiękowych bez kompresji lub z kompresją zapisu. Za pomocą zgromadzonych rejestratorów utrwalono nagrania testowe w 18 różnych formatach zapisu, tj.: Problems of Forensic Sciences 2016, vol. 105, 355–369 Dźwiękowe nagrania testowe oraz ich wykorzystanie w badaniach autentyczności. Baza danych właściwości cyfrowych... 3GP, aiFF, aMR, BWF, DSS, M4a, MP2, MP3, MOD, OMa, OMG, PVc, WaVe aDPcM, WaVe PcM, VM1, VY2 (VY4), VYF i WMa. W tabeli 3 przedstawiono procentowy udział najczęściej występujących formatów w odniesieniu do ogólnej liczby wykonanych nagrań. Przeprowadzona analiza wykazała, że nagrania testowe zarejestrowane zostały w zdecydowanej większości za pomocą dyktafonów cyfrowych i w trzech dominujących formatach zapisu, tj. WaVe aDPcM, WMa i MP3. Większość badanych urządzeń umożliwiała rejestrację tylko w jednym formacie zapisu, jednak spora ich część pozwalała na wybór między dwoma, a nawet trzema różnymi formatami. W przypadku możliwości zapisu przez rejestrator w więcej niż dwóch formatach najczęściej spotykanymi były: WMa i MP3 (stosujące kompresję) oraz WaVe PcM (bez kompresji zapisu). Pojedyncze urządzenia spośród analizowanych umożliwiały zapis w większej liczbie formatów niż trzy i były to głównie zaawansowane technicznie rejestratory dźwięku. Przykładem takiego urządzenia jest Marantz PMD671, który umożliwia zapis dźwięku w czterech różnych formatach, w tym w dwóch nieskompresowanych, tj. WaVe PcM i BWF. Z przeprowadzonej analizy wynika również, że większość badanych urządzeń dla konkretnego formatu pozwala na wybór jakości zapisu i zmianę parametrów. Do tej grupy zaliczyć można głównie dyktafony z zapisem w formatach WMa, MP3 i WaVe PcM. Z kolei urządzenia rejestrujące w formacie aMR, tj. przede wszystkim telefony komórkowe, jak również niektóre dyktafony i odtwarzacze z funkcją nagrywania w formacie WaVe aDPcM, nie umożliwiały zmiany parametrów zapisu, a tym samym wyboru jakości. Ustalono, że parametry wszystkich zarejestrowanych nagrań testowych zawierały się w następujących granicach: rozdzielczość 4–24 bitów na próbkę, częstotliwość próbkowania 8–96 khz, przepływność bitowa 5–2304 kbps oraz zakres pasma częstotliwościowego w przybliżeniu 3,8–40 khz. Małe wartości odpowiadają nagraniom o niskiej jakości z wąskim pasmem częstotliwościowym i zarejestrowanych za pomocą algorytmów odznaczających się silną kompresją. Z kolei wartości duże charakteryzują nagrania o wysokiej jakości z szerokim pasmem częstotliwościowym i utrwalonych głównie w formacie nieskompresowanym WaVe PcM. Wszystkie badane rejestratory umożliwiały wykonanie kopii plików z nagraniami na dysk twardy komputera z wykorzystaniem złącza cyfrowego. część z nich, głównie starsze modele, pozwalały na transfer plików z nagraniami jedynie za pomocą dedykowanego oprogramowania producenta instalowanego w systemie operacyjnym komputera. Przykładowo, dyktafony Olympus i modele serii VN wykorzystują program Digital Wave Player, z kolei rejestratory Sony zapisujące na wymiennych nośnikach typu MiniDisc, tak jak model MZ-Nh900, wymagają instalacji programu SonicStage. Pozostałe reje- 367 stratory pozwalały na bezpośrednią kopię plików z ich pamięci na dysk twardy celem dalszej analizy. Na tej podstawie ustalono, że każdy z badanych rejestratorów automatycznie nadawał nazwy plikom z nagraniami według ustalonego schematu. Przykładowe nazwy plików dźwiękowych dla konkretnych modeli urządzeń przedstawiono poniżej. Nazwy tych plików wskazują na: – model rejestratora i kolejny numer nagrania: DS500001.WMa, WS650001.MP3 albo 801_0182 MP3 (marka Olympus i modele, odpowiednio, DS-50, WS-650S, WS-801), DR-100_0001.WaV (Tascam DR-100), R09_0001.WaV (Roland eDiROL R-09); – transfer za pomocą dedykowanego oprogramowania, oznaczenie folderu zapisu w pamięci urządzenia i numer nagrania: DW_a0001.WaV (oprogramowanie Digital Wave Player, folder a; nazewnictwo to stosowane jest w przypadku rejestratorów Olympus i modeli takich, jak VN-120Pc, VN-1100Pc, VN-2000Pc, VN-2100Pc i VN-3100Pc); – datę albo datę i godzinę rejestracji: VN-2016021600001.amr (BlackBerry 9320), recording-20130809121814.MP3 (Pentagram Tab 7.5), 001-2009-10-08 11_49_40.oma (Sony MZ-Nh900); część nazwy pliku zawierająca wskazanie czasu zależy od ustawień zegara wbudowanego w urządzenie; – numer nagrania: 1001.WaV (Marantz PMD671). Odnotowano również nazwy składające się z następujących oznaczeń: audio, Głos, Mic, MOB, Nagr, Nagranie, Plik audio, Rec, Sound clip, Voice albo VOc wraz z następującym po nim kolejnym numerem nagrania w pamięci urządzenia; takie nazwy plików z nagraniami cechują przede wszystkim telefony komórkowe oraz odtwarzacze z funkcją nagrywania. Pliki dźwiękowe z nagraniami testowymi w każdym analizowanym formacie zapisu posiadają bardziej lub mniej rozbudowane metadane z informacjami dotyczącymi: marki i modelu rejestratora, właściwości zapisu, daty, godziny i czasu trwania nagrania lub ilości danych w pliku. Jak zaznaczono wyżej, istotne informacje zawarte są również w nazwach utrwalanych plików. Na rysunku 1 zwizualizowano w postaci heksadecymalnej (z lewej) i kodu aScii (z prawej) fragment struktury danych w pliku z nagraniem w formacie WaVe aDPcM, czyli takim, który odnotowano najczęściej wśród nagrań testowych. Na rysunku zaznaczono obszar nagłówka pliku, który zawiera metadane z wpisami wskazującymi na liczbę danych w pliku (00 10 8e 34 bajtów w systemie szesnastkowym, zapis w postaci Little endian), format (WaVe aDPcM, kodek iMa, kod 00 11), podstawowe parametry zapisu (1 kanał, częstotliwość próbkowania 22 050 hz, przepływność 88,8 kbps, rozdzielczość 4 bity na każdą próbkę) oraz liczbę danych z zakodowanym dźwiękiem (00 10 8e 00 bajtów). Problems of Forensic Sciences 2016, vol. 105, 355–369 368 M. Michałek Na szczególną uwagę zasługują pliki dźwiękowe utrwalane za pomocą rejestratorów marki Olympus, które zawierają łatwe do zdekodowania wpisy wskazujące na markę i model urządzenia, datę i godzinę początku oraz końca rejestracji nagrania, czas trwania nagrania i jego numer oraz parametry zapisu dźwięku. Dane takie zapisywane są przez większość modeli wskazanej marki. Na rysunku 2 przedstawiono dwa fragmenty struktury danych pliku dźwiękowego zapisanego za pomocą rejestratora Olympus WS-650S w drugim co do częstości występowania formacie wśród nagrań testowych, tj. WMa. Pierwszy fragment struktury (na rysunku w części a) zawiera zaznaczone metadane z wpisami wskazującymi na markę rejestratora (Olympus), model (WS650S), datę oraz godzinę początku i końca rejestracji (2010.01.04 od 16:50:58 do 17:43:57) oraz czas trwania nagrania (00:52:59). Z kolei w drugim fragmencie (w części b) zaznaczono parametry zapisu nagrania, tj. format (WMa), przepływność (32 kbps), częstotliwość próbkowania (44 khz) i liczbę kanałów (1). Programy do automatycznej analizy plików multimedialnych podają niekiedy tylko niektóre parametry ich zapisu lub wartości te są niedokładne, zdarza się też, że w ogóle nie rozpoznają danego formatu. Wtedy głównym źródłem informacji o takim pliku jest analiza jego struktury danych w edytorze szesnastkowym, którą pokrótce opisano wyżej. 5. bazadanychwłaściwościcyfrowych rejestratorówdźwiękuinagrańoraz możliwościichkonwersjidoformatu WaVe pcm W ramach wykonanych prac wszystkie rejestratory, za pomocą których utrwalono nagrania testowe, zostały jednolicie skatalogowane. W katalogu głównym każdego z nich znajdują się pogrupowane informacje dotyczące dokumentacji technicznej i fotograficznej, oprogramowania do konwersji z formatu źródłowego do standardowego i nieskompresowanego WaVe PcM oraz nagrania testowe w formacie źródłowym i przekonwertowane do WaVe PcM. Zbiór skatalogowanych i usystematyzowanych informacji stanowił podstawę do skonstruowania relacyjnej bazy danych w oprogramowaniu Microsoft access wraz z interfejsem użytkownika. Przedmiotowa baza dla każdego zbadanego urządzenia zawiera następujące informacje: rodzaj urządzenia, opis marki i modelu, dokumentację, wskazanie możliwości rejestracji (audio lub wideo), wykaz dostępnych formatów zapisu i rozszerzeń plików dźwiękowych, opis podstawowych parametrów nagrań, dostęp do katalogu z plikami w źródłowych formatach zapisu i przekonwertowanych oraz do katalogu z programami do konwersji nagrań do formatu WaVe PcM. Fragment widoku tabeli głównej wykonanej bazy danych przedstawiono na rysunku 3. Zamieszczenie w bazie danych plików z nagraniami w źródłowym formacie umożliwia wykonanie analizy porównawczej ich parametrów zarówno pomiędzy takimi samymi modelami danej marki, jak i analizowanymi nagraniami dowodowymi. Zgromadzenie w jednym miejscu usystematyzowanych danych o cyfrowych rejestratorach dźwięku oraz o parametrach ich nagrań i programach do konwersji umożliwia szybki dostęp do istotnych informacji w trakcie badań fonoskopijnych i znacznie oszczędza czas. Otwarta struktura skonstruowanej bazy pozwala na jej uzupełnianie o kolejne informacje i nagrania. Zwykle istnieje możliwość odtworzenia zarejestrowanego nagrania za pomocą urządzenia, którym zostało ono zarejestrowane, jednakże w trakcie badań fonoskopijnych wykorzystuje się profesjonalne oprogramowania komputerowe służące do odtwarzania i analizy nagrań. Zdarza się też, że zgromadzony materiał do badań nie zawiera urządzenia, którym zarejestrowano nagranie będące przedmiotem analizy. W związku z tym przeanalizowano możliwość odtwarzania utrwalonych nagrań testowych w ich formatach źródłowych oraz konwersję do formatu standardowego i nieskompresowanego, tj. WaVe PcM, za pomocą programów komputerowych. Odtworzenie w źródłowym formacie daje często możliwość wstępnej oceny nagrania i ustalenie utrwalonych w nim treści. Z kolei konwersja do postaci WaVe PcM umożliwia import nagrania do przestrzeni roboczej profesjonalnych programów w celu wykonania badań odsłuchowych i spisania treści, analizy charakterystyk czasowych i częstotliwościowych w trakcie badań autentyczności, jak również parametrów sygnału mowy podczas badaniach identyfikacyjnych mówców. Popularne obecnie formaty zapisu nagrań, takie jak WaVe PcM i aDMcP, MPeG-1 i MPeG-2 audio Layer iii (MP3), WMa, 3GP lub aMR są dobrze znane i udokumentowane (3GPP, 2010; 3GPP, 2011; iSO/iec, 1992; Microsoft corp., 1994, Microsoft corp., 2010). Dostępnych jest również wiele użytecznych narzędzi pozwalających na ich analizę oraz odtwarzanie i konwersję do formatu nieskompresowanego WaVe PcM. Jednak niektórzy producenci cyfrowych rejestratorów dźwięku stosują własne i niestandardowe formaty zapisu z bardzo ubogą lub w ogóle pozbawione ogólnodostępnej dokumentacji. Problematyczne staje się wówczas odtworzenie takiego nagrania oraz wykonanie jego konwersji do formatu WaVe PcM w celu analizy w odpowiednim oprogramowaniu. Może również okazać się, że analiza struktury danych plików z takimi nagraniami i zdekodowanie metadanych możliwe jest jedynie w ograniczonym zakresie. Wśród darmowych programów, które umożliwiają odtworzenie lub konwersję większości standardowych Problems of Forensic Sciences 2016, vol. 105, 355–369 Dźwiękowe nagrania testowe oraz ich wykorzystanie w badaniach autentyczności. Baza danych właściwości cyfrowych... formatów zapisu do WaVe PcM, wyróżnić można następujące: Pazera Free audio extractor obsługiwany z linii poleceń ffmpeg i powiązany z nim ffplay, Mobile Media converter oraz VLc media player. Podczas badań wykorzystano również profesjonalne oprogramowanie adobe audition. Wymienione programy umożliwiły przekonwertowanie zarejestrowanych nagrań testowych z następujących formatów: WaVe aDPcM, WMa, aMR, MP3, MP2, 3GP, M4a, aiFF, MOD i BWF do postaci nieskompresowanej WaVe PcM. Dla nagrań testowych utrwalonych w mało popularnych formatach do ich odtworzenia i konwersji do formatu WaVe PcM niezbędne było wykorzystanie dedykowanych programów producenta konkretnego rejestratora. Zgromadzone nagrania testowe w plikach dźwiękowe o rozszerzeniach: VM1, PVc, DSS, VY2 (VY4), VYF oraz OMa i OMG mogą zostać odtworzone oraz przekonwertowane za pomocą oprogramowań, odpowiednio: Voice editing, Voice editing Mini Player i Voice editing, DSS Player Lite i DSS Player v.7, Voice yepp Player i WaV_converter, Samsung Voice Manager oraz SonicStage. 369 Podziękowania Opisane w niniejszym artukule prace zostały wykonane w ramach projektu badawczego nr X/k zrealizowanego w instytucie ekspertyz Sądowych im. Prof. dra Jana Sehna w krakowie. 6. podsumowanie W pracy opisano znaczenie i wykorzystanie dźwiękowych nagrań testowych do celów badania autentyczności nagrań dowodowych. Przedstawiono właściwości przebadanych urządzeń z funkcją rejestracji dźwięku i parametry utrwalonych za ich pomocą nagrań testowych, a także skonstruowaną na tej podstawie bazę danych. Zebrany i usystematyzowany zbiór danych pozwala na szybką weryfikację parametrów konkretnego modelu rejestratora i jego nagrań, jak również ustalenie oprogramowania do konwersji z formatu źródłowego do PcM WaVe, co umożliwia dalszą analizę nagrań. Otwarta struktura skonstruowanego zbioru pozwala na jego aktualizowanie i uzupełnianie o nowe dane wraz z analizą kolejnych modeli urządzeń umożliwiających rejestrację nagrań. Wyniki przeprowadzonych badań i przedmiotowa baza danych są wykorzystywane w bieżącej działalności opiniodawczej jako narzędzie wpomagające w badaniach autentyczności nagrań. Należy dodać, że tworzony zbiór informacji o cyfrowych urządzeniach rejestrujących i ich nagraniach z całą pewnością może być być pomocny do badań nie tylko z zakresu fonoskopii, ale także w obszarach pokrewnych, na przykład w informatyce sądowej. Stanowi również dostateczny materiał do przeprowadzenia innych badań z zakresy analizy nagrań dźwiękowych. Problems of Forensic Sciences 2016, vol. 105, 355–369