文档章节

将文本文件的内容存储在DataSet中的方法总结

彭泽0902
 彭泽0902
发布于 2016/11/24 18:47
字数 647
阅读 0
收藏 0

    项目中比较多的会对文件进行操作,例如文件的上传下载,文件的压缩和解压等IO操作。在.NET项目中较多的会使用DataSet,DataTable进行数据的缓存。

    项目中对文本文件的操作比较简单,但是如果需要将文本文件的内容写入系统的缓存中,操作起来,会稍微的繁琐一些。现在总结一个较为通用的方法,将文本文件的内容缓存进入DataSet数据集中。

private DataSet _iifSet;

        /// <summary>
        /// 将文本文件转化为DataSet
        /// </summary>
        /// <param name="filePath"></param>
        /// <returns></returns>
        public DataSet Parse(string filePath)
        {

        if (string.IsNullOrEmpty(filePath))
        {
          throw new ArgumentNullException(filePath);
        }

try
            {
                _iifSet = new DataSet();
                var fileText = System.IO.File.ReadAllText(filePath);
                var lines = fileText.Split('\n');
                CreateTables(lines, _iifSet);
                FillSet(lines, _iifSet);
                return _iifSet;
            }
            catch (IOException ex)
            {
                throw new IOException(ex.Message);
            }
            
        }

        /// <summary>
        /// 读取行数组并将其解析为数据集的表
        /// </summary>
        /// <param name="lines">String iif文件中的行数组</param>
        /// <param name="set"></param>
        private void FillSet(IReadOnlyList<string> lines, DataSet set)
        {
            for (var i = 0; i < lines.Count; i++)
            {
                if (IsTableHeader(lines[i]))
                {
                    continue;
                }
                if (lines[i] == "" || lines[i] == "\r" || lines[i] == "\n\r" || lines[i] == "\n")
                {
                    continue;
                }
                if (lines[i].IndexOf(";__IMPORTED__", StringComparison.Ordinal) != -1)
                {
                    continue;
                }
                var line = lines[i];
                while (!IsFullLine(line, set))
                {
                    i++;
                    line += lines[i];
                }
                ParseRecord(line, set);
            }
        }

        /// <summary>
        /// 解析记录
        /// </summary>
        /// <param name="line"></param>
        /// <param name="set"></param>
        private void ParseRecord(string line, DataSet set)
        {
            if (IsTableHeader(line))
            {
                return;
            }
            var tablename = line.Split('\t')[0];
            var parameters = CreateDataRowParams(line, set.Tables[tablename].Columns.Count);
            if (parameters.Length > 0)
                set.Tables[tablename].Rows.Add(parameters);
        }

        private bool IsFullLine(string line, DataSet set)
        {
            if (IsTableHeader(line))
            {
                return true;
            }
            var values = line.Split('\t').Length;
            var tableName = line.Split('\t')[0];
            var columns = set.Tables[tableName].Columns.Count;
            return values >= columns;
        }

        private bool IsTableHeader(string tab)
        {
            return tab.StartsWith("!");
        }


        /// <summary>
        /// 创建datatable
        /// </summary>
        /// <param name="lines"></param>
        /// <param name="set"></param>
        private void CreateTables(IReadOnlyList<string> lines, DataSet set)
        {
            foreach (var t in lines.Where(IsTableHeader))
            {
                set.Tables.Add(CreateTable(t));
            }
        }


        private DataTable CreateTable(string line)
        {
            var values = line.Split('\t');
            values[0] = values[0].Substring(1);
            var dt = new DataTable(values[0]);
            values[0] = null;
            foreach (var name in values)
            {
                if (string.IsNullOrEmpty(name))
                    continue;
                var dc = new DataColumn(name, typeof(string));
                try
                {
                    dt.Columns.Add(dc);
                }
                catch (DuplicateNameException)
                {
                    dc = new DataColumn(name + "_duplicateCol" + dt.Columns.Count);
                    dt.Columns.Add(dc);
                }
            }

            return dt;
        }

        public string GetTableName(string line)
        {
            var values = line.Split('\t');
            if (values[0].StartsWith("!"))
            {
                values[0] = values[0].Substring(1);
            }
            return values[0];
        }

        public readonly static object[] EmptyStringArray = { };

        private object[] CreateDataRowParams(string line, int maxLength)
        {
            var raw = line.Split('\t');
            var length = raw.Length - 1;
            if (length == 0 || maxLength == 0)
                return EmptyStringArray;
            if (length > maxLength)
                length = maxLength;
            var values = new string[length];
            for (var i = 0; i < length; i++)
            {
                values[i] = raw[i + 1];
            }

            if (values[values.Length - 1].EndsWith("\n"))
            {
                values[values.Length - 1] = values[values.Length - 1].Substring(0, values[values.Length - 1].LastIndexOf('\n'));
            }
            else if (values[values.Length - 1].EndsWith("\n\r"))
            {
                values[values.Length - 1] = values[values.Length - 1].Substring(0, values[values.Length - 1].LastIndexOf("\n\r", StringComparison.Ordinal));
            }
            else if (values[values.Length - 1].EndsWith("\r"))
            {
                values[values.Length - 1] = values[values.Length - 1].Substring(0, values[values.Length - 1].LastIndexOf('\r'));
            }

            return values;
        }

        protected virtual void Dispose(bool cleanAll)
        {
            _iifSet?.Dispose();
        }

        public void Dispose()
        {
            Dispose(true);
            GC.SuppressFinalize(this);
        }

     有关dataset的一些常用的操作,基本属性和方法在这里就不做介绍了。

© 著作权归作者所有

共有 人打赏支持
彭泽0902
粉丝 0
博文 44
码字总数 57771
作品 0
武汉
高级程序员
ado.net技术总结

1、ado.net技术概述 ado.net是一组允许.net开发人员使用标准的,结构化的,甚至无连接的方式与数据交互的技术。使用ado.net技术可以使用一致的访问方式操作多种数据源,包括数据库、xml、exc...

andrewniu
2017/12/01
0
0
Spark SQL数据源

背景 Spark SQL是Spark的一个模块,用于结构化数据的处理。 使用Spark SQL的方式有2种,可以通过SQL或者Dataset API,这两种使用方式在本文都会涉及。 其中,通过SQL接口使用的方法具体又可分...

金珑
2017/10/28
0
0
厚积薄发,丰富的公用类库积累,助你高效进行系统开发(4)----CSV、Excel、INI文件、独立存储等文件相关

1、CSV文件和DataTable对象转换辅助类 CSVHelper 实现效果 1)本辅助类主要是用来方便实现CSV文件和DataTable对象的相互转换。 2)逗号分隔型取值格式(英文全称为Comma Separated Values,简...

长平狐
2012/08/22
103
0
厚积薄发,丰富的公用类库积累,助你高效进行系统开发(4)----CSV、Excel、INI文件、独立存储等文件相关

1、CSV文件和DataTable对象转换辅助类 CSVHelper 实现效果 1)本辅助类主要是用来方便实现CSV文件和DataTable对象的相互转换。 2)逗号分隔型取值格式(英文全称为Comma Separated Values,简...

长平狐
2012/06/11
559
0
[大数据之Spark]——Actions算子操作入门实例

Actions reduce(func) Aggregate the elements of the dataset using a function func (which takes two arguments and returns one). The function should be commutative and associative ......

青夜之衫
2017/12/04
0
0

没有更多内容

加载失败,请刷新页面

加载更多

Docker学习笔记

Docker Resources All In One Docker 学习资源整理

OSC_fly
15分钟前
3
0
Android 安全逆向:篡改你的位置信息

篡改你的位置信息

蔡小鹏
16分钟前
2
0
SpringMVC 全局异常处理,返回json

1.在spring-mvc.xml中增加配置: 比如我的freemarker视图定义的是:/WEB-INF/template 我的页面则放在template下的common目录下,所以下方定义的是common/500,文件扩展名根据视图定义可以忽...

Gmupload
17分钟前
2
0
一篇文章搞定前端面试

本文旨在用最通俗的语言讲述最枯燥的基本知识 面试过前端的老铁都知道,对于前端,面试官喜欢一开始先问些HTML5新增元素啊特性啊,或者是js闭包啊原型啊,或者是css垂直水平居中怎么实现啊之...

Jack088
23分钟前
3
0
ajax 轮询请求后台服务器

<script type="text/javascript"> // var i=0; //声明轮询次数变量 $(document).ready(function(){ c = window.setInterval("getResult()",10000); //间隔多少秒去触发ajax }); function get......

15834278076
26分钟前
1
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部