05-图3. 六度空间 (30)

“六度空间”理论又称作“六度分隔（Six Degrees of Separation）”理论。这个理论可以通俗地阐述为：“你和任何一个陌生人之间所间隔的人不会超过六个，也就是说，最多通过五个人你就能够认识任何一个陌生人。”如图6.4所示。

“六度空间”理论虽然得到广泛的认同，并且正在得到越来越多的应用。但是数十年来，试图验证这个理论始终是许多社会学家努力追求的目标。然而由于历史的原因，这样的研究具有太大的局限性和困难。随着当代人的联络主要依赖于电话、短信、微信以及因特网上即时通信等工具，能够体现社交网络关系的一手数据已经逐渐使得“六度空间”理论的验证成为可能。

假如给你一个社交网络图，请你对每个节点计算符合“六度空间”理论的结点占结点总数的百分比。

输入格式说明：

输入第1行给出两个正整数，分别表示社交网络图的结点数N （1<N<=104，表示人数）、边数M（<=33*N，表示社交关系数）。随后的M行对应M条边，每行给出一对正整数，分别是该条边直接连通的两个结点的编号（节点从1到N编号）。

输出格式说明：

对每个结点输出与该结点距离不超过6的结点数占结点总数的百分比，精确到小数点后2位。每个结节点输出一行，格式为“结点编号:（空格）百分比%”。

样例输入与输出：

序号	输入	输出
1	10 9	1: 70.00%
	1 2	2: 80.00%
	2 3	3: 90.00%
	3 4	4: 100.00%
	4 5	5: 100.00%
	5 6	6: 100.00%
	6 7	7: 100.00%
	7 8	8: 90.00%
	8 9	9: 80.00%
	9 10	10: 70.00%
2	10 8	1: 70.00%
	1 2	2: 80.00%
	2 3	3: 80.00%
	3 4	4: 80.00%
	4 5	5: 80.00%
	5 6	6: 80.00%
	6 7	7: 80.00%
	7 8	8: 70.00%
	9 10	9: 20.00%
		10: 20.00%
3	11 10	1: 100.00%
	1 2	2: 90.91%
	1 3	3: 90.91%
	1 4	4: 100.00%
	4 5	5: 100.00%
	6 5	6: 100.00%
	6 7	7: 100.00%
	6 8	8: 100.00%
	8 9	9: 100.00%
	8 10	10: 100.00%
	10 11	11: 81.82%
4	2 1	1: 100.00%
	1 2	2: 100.00%

代码如下：

#include<iostream>
#include<vector>
#include<queue>
#include<iomanip>

using namespace std;

class Graph
{
public:

    Graph(int vertexNum, int edgeNum):vertexNum(vertexNum), edgeNum(edgeNum)
    {
        m_graph.resize(vertexNum + 1);          //initialize values
        visited.resize(vertexNum + 1, 0);
        countNum = 0;
        int startVertex = 0, endVertex = 0;
        for(int i = 0; i < edgeNum; ++i)    //create graph
        {
            cin >> startVertex >> endVertex;
            m_graph[startVertex].push_back(endVertex);
            m_graph[endVertex].push_back(startVertex);
        }
    };
    void Traversal();
    void DFS(int index);
    void BFS(int index);
    int CountVisitedNum();
private:
    int vertexNum;
    int edgeNum;
    int countNum;       // the number of level
    vector<int> visited;
    vector<vector<int> > m_graph;
};

void Graph::Traversal()
{
    for(int i = 1; i < vertexNum + 1; ++i)      //for each element , traversal
    {
        BFS(i);         //DFS(i);
        countNum = 0;
        int visitedNum = CountVisitedNum();     //compute visited element number
        cout << i << ": ";
        cout << fixed << setprecision(2) << (float)visitedNum  / (float)vertexNum * 100.0 << "%" << endl;
    }
}

void Graph::DFS(int index)
{
    if(!visited[index])
    {
        visited[index] = 1;
        if(6 == countNum)   //µ½´ïµÚÁù²ã
        {
            return;
        }
        for(int i = 0; i < m_graph[index].size(); ++i)
        {
            ++countNum;
            DFS(m_graph[index][i]);
            --countNum;
        }
    }
}

void Graph::BFS(int index)
{
    queue<int> queueGraph;
    queueGraph.push(index);
    int level = 0;
    int last = index;    //标记到达这一层的末尾元素
    int num = 0;        //num 表示这一层元素有多少个
    while(!queueGraph.empty())
    {
        if(!visited[queueGraph.front()])
        {
            visited[queueGraph.front()] = 1;

            for(int i = 0; i < m_graph[queueGraph.front()].size(); ++i)
            {
                queueGraph.push(m_graph[queueGraph.front()][i]);
            }
        }
        if(last == queueGraph.front() && !num)  //当这一层元素到达末尾且这一层元素即将遍历完时，更新
            //为什么用两个条件一起判断呢，因为在这一层元素未遍历完之前，可能前面会有和末尾元素相同的值，所以额外加一个num值为0作为辅助判断
        {
            ++level;
            num = queueGraph.size() - 1;
            last = queueGraph.back();
        }
        --num;
        if(7 == level)  //我将初始元素作为第一层，所以等于7，break
        {
            break;
        }
        queueGraph.pop();
    }
}
int Graph::CountVisitedNum()    //计算他所能访问的元素个数，顺便将visited恢复到初始状态
{
    int num = 0;
    for(int i = 1; i < vertexNum + 1; ++i)
    {
        if(visited[i])
        {
            ++num;
            visited[i] = 0;
        }
    }
    return num;
}
int main()
{
    int N = 0, M = 0;
    cin >> N >> M;
    Graph graph(N, M);
    graph.Traversal();
    return 0;
}

刚开始用DFS写的，但是写完之后，测试点4过不了，但是速度快，DFS测试点4我的用时只有20ms，虽然没过，但是BFS就是其10倍还不止，而且我现在还是没有把DFS的bug修复好。
最后一个测试数据，问陈越老师，陈越老师说是1000个点组成一个环，然后前面64个点一次与后面500个点相连，也就是1000个点，1000+64*500=33000个边。根据这个数据，我知道bug出在哪里，后面就看了一下陈越老师的解法，看完之后只知道要做个标记，具体给忘了，然后就自己想想，写了个四不像的，核心思想应该跟陈越老师的是一样的。

做完这道题，PAT成绩终于进第二页了，争取开学之前进首页。
测试数据如下：

测试点	结果	用时(ms)	内存(kB)	得分/满分
0	答案正确	1	308	18/18
1	答案正确	1	308	3/3
2	答案正确	1	180	3/3
3	答案正确	1	180	3/3
4	答案正确	224	1056	3/3

在看陈越老师讲最短路径又提到了BFS算法，发现这道题当时解法有点耗时，因为我把重复元素加进来了，如果把visited位置换掉，耗时更短。
代码如下：

#include<iostream>
#include<vector>
#include<queue>
#include<iomanip>

using namespace std;

class Graph
{
public:

    Graph(int vertexNum, int edgeNum):vertexNum(vertexNum), edgeNum(edgeNum)
    {
        m_graph.resize(vertexNum + 1);          //initialize values
        visited.resize(vertexNum + 1, 0);
        countNum = 0;
        int startVertex = 0, endVertex = 0;
        for(int i = 0; i < edgeNum; ++i)    //create graph
        {
            cin >> startVertex >> endVertex;
            m_graph[startVertex].push_back(endVertex);
            m_graph[endVertex].push_back(startVertex);
        }
    };
    void Traversal();
    void DFS(int index);
    void BFS(int index);
    int CountVisitedNum();
private:
    int vertexNum;
    int edgeNum;
    int countNum;       // the number of level
    vector<int> visited;
    vector<vector<int> > m_graph;
};

void Graph::Traversal()
{
    for(int i = 1; i < vertexNum + 1; ++i)      //for each element , traversal
    {
        BFS(i);         
        countNum = 0;
        int visitedNum = CountVisitedNum();     //compute visited element number
        cout << i << ": ";
        cout << fixed << setprecision(2) << (float)visitedNum  / (float)vertexNum * 100.0 << "%" << endl;
    }
}

void Graph::BFS(int index)
{
    visited[index] = 1;
    queue<int> queueGraph;
    queueGraph.push(index);
    int level = 0;
    int last = index;    //标记到达这一层的末尾元素
    int num = 0;        //num 表示这一层元素有多少个
    while(!queueGraph.empty())
    {
        for(int i = 0; i < m_graph[queueGraph.front()].size(); ++i)
        {
            if(!visited[m_graph[queueGraph.front()][i]])		//判断是否被访问过，被访问过，就不加进队列
			//之前那种判断方式是把if判断放在外面，这样虽然那个结点没被访问过，但是其邻接点可能被访问过，所以当时后面加了num来计数辅助判断，这样因为没有重复元素，所以不需要num辅助判断了
            {
                visited[m_graph[queueGraph.front()][i]] = 1;
                queueGraph.push(m_graph[queueGraph.front()][i]);
            }
        }
        if(last == queueGraph.front())
        {
            ++level;
            last = queueGraph.back();
        }
        if(6 == level)			//这里的level改成6了，
        {
            break;
        }
        queueGraph.pop();
    }
}
int Graph::CountVisitedNum()    //计算他所能访问的元素个数，顺便将visited恢复到初始状态
{
    int num = 0;
    for(int i = 1; i < vertexNum + 1; ++i)
    {
        if(visited[i])
        {
            ++num;
            visited[i] = 0;
        }
    }
    return num;
}
int main()
{
    int N = 0, M = 0;
    cin >> N >> M;
    Graph graph(N, M);
    graph.Traversal();
    return 0;
}

代码中if(6 == level)改为6，而不是原来的7，经过的我的思考，我认为原因是这样的：之前是只有当前结点没被访问过，才会将执行visited[m_graph[queueGraph.front()][i]] = 1;，并且将当前的结点push进队列时，并没有将当前push进去的结点的visited设为1；
而在这里，不需要判断当前结点是否被访问过，就会把当前结点的所有未被访问的邻接结点的visited设为1，并push进队列，相对于之前的那种做法，他向前多做了一步把实际上还未访问的结点的visited设为1，而在我的代码中统计结点是否被访问恰好就是看visited的值是否为1，为1代表访问了，算入累计值，所以这里到6就要停下了，因为他提前就把第六层的结点的visited设为1了，就不需要在访问第六层结点了。
个人理解，如果有误，欢迎指正！

测试结果：

测试点	结果	用时(ms)	内存(kB)	得分/满分
0	答案正确	1	308	18/18
1	答案正确	1	308	3/3
2	答案正确	1	308	3/3
3	答案正确	1	308	3/3
4	答案正确	64	820	3/3