#include <datasource.h>

Inheritance diagram for ebl::datasource< Tnet, Tdata >:

Public Types
typedef map< uint, idx< Tdata > >	t_pick_map
Public Member Functions
	datasource ()
	CAUTION: This empty constructor requires a subsequent call to init().
	datasource (midx< Tdata > &data, const char *name=NULL)
	datasource (idx< Tdata > &data, const char *name=NULL)
	datasource (const char data_fname, const char name=NULL)
virtual	~datasource ()
	destructor
void	init (midx< Tdata > &data, const char *name)
	Initialize from a multi-matrix data.
void	init (idx< Tdata > &data, const char *name)
	Initialize.
template<class Tstate >
void	fprop_data (mstate< Tstate > &s)
	Copies current sample's data into s.
virtual void	fprop_data (fstate_idx< Tnet > &s)
	Copies current sample's data into s.
virtual void	fprop_data (bbstate_idx< Tnet > &s)
	Copies current sample's data into s.
virtual void	fprop (bbstate_idx< Tnet > &s)
	Copies current sample's data into s.
virtual idx< Tdata >	get_sample (intg index)
	Return original sample's idx at this index.
virtual idx< Tnet >	get_raw_output (intg index=-1)
virtual void	select_sample (intg index)
virtual void	shuffle ()
virtual bool	next ()
virtual bool	next_train ()
virtual void	set_data_bias (Tnet bias)
	Set the bias to add to the data.
virtual void	set_data_coeff (Tnet coeff)
	Set the coefficient to multiply the data with.
virtual unsigned int	size ()
	Returns the number of data instances contained in this data source.
virtual idxdim	sample_dims ()
virtual mfidxdim	sample_mfdims ()
virtual void	set_sample_energy (double e, bool correct, idx< Tnet > &raw_outputs, idx< Tnet > &answers, idx< Tnet > &target)
virtual void	keep_outputs (bool keep=true)
virtual void	normalize_all_probas ()
	Normalize picking probabilities globally with maximum probability.
virtual void	normalize_probas (vector< intg > *cindinces=NULL)
	Normalize picking probabilities globally with maximum probability.
virtual void	seek_begin ()
virtual void	seek_begin_train ()
virtual void	set_shuffle_passes (bool activate)
virtual void	set_weigh_samples (bool activate, bool hardest_focus=false, bool perclass_norm=true, double min_proba=0.0)
virtual void	set_test ()
virtual bool	is_test ()
	Returns true if this datasource is a test datasource only.
virtual intg	get_epoch_size ()
virtual intg	get_epoch_count ()
	Return the number of samples this epoch has processed.
virtual void	set_epoch_size (intg sz)
virtual void	set_epoch_mode (uint mode)
virtual bool	epoch_done ()
virtual void	init_epoch ()
virtual void	save_pickings (const char *name=NULL)
virtual bool	get_count_pickings ()
	Return true if counting of pickings is enabled.
virtual void	set_count_pickings (bool count=true)
	Enable or disable the counting of pickings.
virtual string &	name ()
	Return name of dataset.
virtual void	set_epoch_show (uint modulo)
	Print training count every module samples.
virtual void	ignore_correct (bool ignore=true)
	Do not train on correctly classified examples if ignore is true.
virtual bool	mstate_samples ()
	Each sample contains multiple states or not.
virtual void	save_state ()
virtual void	restore_state ()
	Restore previously saved internal iterators.
virtual void	pretty ()
	Print info about the datasource on the standard output.
virtual void	pretty_progress (bool newline=true)
Public Attributes
Tnet	bias
Tnet	coeff
idx< Tdata >	data
midx< Tdata >	datas
idx< double >	probas
	sample probabilities
idx< double >	energies
	sample energies
idx< ubyte >	correct
	sample correctness
idx< Tnet >	raw_outputs
	The raw outputs for each sample.
idx< Tnet >	answers
	all answers
idx< Tnet >	targets
	all targets
idx< uint >	pick_count
	count pickings.
bool	count_pickings
	Count which samples are picked.
bool	count_pickings_save
unsigned int	height
unsigned int	width
string	_name
Protected Member Functions
void	init2 (const char *name)
	Initialize. Should be called only after data matrix has been assigned.
virtual bool	pick_current ()
virtual map< uint, intg > &	get_pickings ()
	Return a vector of sample indices, sorted by their picking counts.
Protected Attributes
vector< intg >	counts
map< uint, intg >	picksmap
bool	multimat
	True if data is a multi-matrix matrix.
bool	bkeep_outputs
	Keep model outputs for each sample. /////////////////////////////////////////////////////////////////////////.
intg	it
	Index of current sample in data matrix.
intg	it_test
	Current test index in data matrix.
intg	it_train
	Current train index in vector 'indices'.
idx< intg >	indices
	Vector of indices to the data matrix. /////////////////////////////////////////////////////////////////////////.
bool	state_saved
	State has been saved or not.
intg	it_saved
	Saving current iterator it.
intg	it_test_saved
	Saving current test iterator.
intg	it_train_saved
	Saving current train iterator.
idx< intg >	indices_saved
	Saving sample indices.
intg	epoch_cnt_saved
intg	epoch_pick_cnt_saved
	# pickings
vector< intg >	epoch_done_counters_saved
bool	shuffle_passes
	Shuffle at end of each pass.
bool	test_set
	This set is a test set or not. /////////////////////////////////////////////////////////////////////////.
vector< intg >	epoch_done_counters
intg	epoch_sz
intg	epoch_cnt
intg	epoch_pick_cnt
	# pickings
uint	epoch_show
intg	epoch_show_printed
uint	epoch_mode
	0: fixed number, 1: all at least once
timer	epoch_timer
timer	test_timer
uint	not_picked
bool	hardest_focus
	Focus training on hardest samples.
bool	_ignore_correct
	Do not train on correct samples. /////////////////////////////////////////////////////////////////////////.
bool	weigh_samples
	Use probas to pick samples.
bool	perclass_norm
	Normalize probas per class.
double	sample_min_proba
	Minimum proba of each sample.
idxdim	sampledims
	Dimensions of a data sample.
mfidxdim	samplemfdims
	Dimensions of a data sample.

Detailed Description

template<typename Tnet, typename Tdata>
class ebl::datasource< Tnet, Tdata >

A class handling a data source. This datasource does can not contain labels, see 'labeled_datasource' or 'class_datasource' for regression and classification tasks.